Голландські програмісти з Університету міста Твенте розробили онлайн-програму, здатну досить точно визначати стать та вік користувача соцмережі Twitter, аналізуючи його повідомлення у мережі мікроблогінгу. Розробники кажуть, що нещодавно завершили тестування програми на базі 3000 twitter-користувачів, які регулярно відправляли у соцмережу короткі повідомлення на різні теми. У програмі була створена база знань, яка за допомогою синтаксичного, семантичного, словникового та інших типів аналізу виявляла статеву та вікову приналежність відправника повідомлень.
Розробники кажуть, що програмі для досить чіткого визначення необхідно проаналізувати близько 200 твітів користувача і після цього оператор програми може просто ввести нік користувача, а програма видасть інформацію про те, що може ховатися за цим псевдонімом.
"Наш аналіз показав, що різниця між блогерами чоловіками і жінками досить стереотипна. Простіше кажучи, чоловіки частіше говорять про футбол і політику, жінки - про нігті", - говорить Донг Нгуєн, один з розробників програми. "З позиції віку, молоді користувачі частіше говорять про себе самих і використовують багато смайликів, тоді як вікові користувачі застосовують більш складні словникові обороти і частіше говорять на нетипові теми".
Окрім того, Нгуєн каже, що за своєю природою твіти молодих користувачів більш емоційні, часто мають вкрай позитивне або вкрай негативне забарвлення, що рідко зустрічається у користувачів старше 30 років.
Поки програма аналізує твіти тільки голландською та має відносну похибку в 4 роки при виявленні віку. !zn
Читайте також:
Twitter запустив власний музичний сервіс
Twitter-програма дозволить продовжити блог після смерті користувача