Разработка была названа SONG (SocialNetworkWriteGenerator– генератор постов в социальных сетях). Полное число постов, которые были подвергнуты анализу, превысило 12 миллионов. Их написали 2,4 миллиона пользователей 3 в период с 25 ноября по 4 декабря 2008 года.
Авторы работы не стали учитывать тех пользователей, которые писали менее одного поста в течение 19 дней – таких оказалось около 75 процентов. Также из исследования исключались спам-аккаунты. После таких «отчислений» ученые сосредоточились на 350 тысячах пользователей.
Проанализировав характер написания постов этими пользователями, авторы вывели некоторые закономерности. В частности, они ожидаемо выявили, что число постов нарастает в течение дня и уменьшается ночью, а также определили, как изменяется их количество в более мелкие временные отрезки в течение суток. Кроме того, ученые нашли законы, которые определяют время появления каждого следующего поста – оно подчиняется логарифмически-нормальному распределению.
SONG будет использована учеными для изучения поведения людей в Сети. Кроме того, изобретенная модель сможет предсказывать, что будет происходить при тех или иных «внештатных» ситуациях вроде появления неожиданного информационного повода, который спровоцирует большое количество постов. Авторы протестировали модель, запустив ее на 16 компьютерах. Оказалось, что при частоте постов в 100 штук в секунду она начинает «тормозить». При появлении 150 постов в секунду SONG переставала работать. По мнению исследователей, этот результат может означать, что «настоящий» Twitter базируется более чем на 16 серверах.
По материалам Лента.ru