twitter-database

755 000 твітів, або Як російська «Фабрика тролів» намагалась впливати на порядок денний в Україні. Дослідження

VoxUkraine дослідив понад 750 000 твітів пов'язаних з російським «Агентством інтернет-досліджень» і знайшов докази неодноразових інформаційних атак. Як працює російська пропаганда?

Автор: Олександр Надельнюк

В середині жовтня компанія «Twitter, Inc» опублікувала архів даних з понад 9 мільйонами твітів, які за версією соціальної мережі причетні до російського «Агентства Інтернет-досліджень». Можливо, така відкритість Інтернет-гіганту пов’язана з розслідуванням втручання російських спецслужб у вибори Президента США 2016 року.

Опублікований масив даних містить інформацію про 3667 акаунт, які пов'язані з російським Агентством Інтернет-досліжень (відома також як «фабрика тролів»).

Ми вже писали про вплив російських twitter-ботів на британський референдум щодо Brexit: співзнасновники VoxUkraine Олександр Талавера та Юрій Городніченко першими науково довели спроби росіян через Twitter повпливати на Brexit.

Ми поставили перед собою завдання дослідити, чи були намагання акаунтів, пов’язаних з російським «Агентством Інтернет-досліджень», повливати на думку користувачів Твіттер щодо якогось українського питання чи події. Для цього ми віднайшли по ключовим словам 775 тисяч твітів, які стосувались України. У дослідженні ми дослідити тематику твітів, визначили найбільш популярні події для висвітлення за останні вісім років та віднайшли акаунти, які твітили майже 33 години підряд.

Що є у 9 млн твітів, або як ми рахували

У датасеті 55% твітів російською мовою, 37% — англійською, а 8% — інші. VoxUkraine вирішив проаналізувати, скільки повідомлень безпосередньо стосувались України. Для цього ми відфільтрували 9 млн твітів по ключових словах, що з великою вирогідністю маркують допис, як той що має відношення до України. Пошук по ключовим словам виявив майже 775 000 твітів.

Для виокремлення повідомлень, крім варіацій слова «Україна», ми шукали твіти по актуальним українським темам, персоналіям (наприклад, Порошенко і Янукович) та ключовим наративами російської пропаганди. Повний перелік слів-маркерів: «Юго-восток», «Донбасс», «Боинг», «МВФ», «Бандера», «бандеровцы», «каратель», «ополченец», «фашизм», «ВСУ», «Киев», «революция», «Майдан», «Крым», «Донецк», «Луганск», «Россия-Украина», «Порошенко», «Янукович», «гражданская война», «ДНР», «ЛНР», «народная республика», «Госдеп», «конфликт на Украине», «Минобороны Украины», «MH-17», «ГТС», «Тимошенко», «хохлы», «переселенцы».

Період пошуку: січень 2010 - травень 2018.

Що це за акаунти

За трохи більше 8 років у датасеті з «Фабрики тролів» знайшлося 774 957 твітів про Україну, які згенерували 1369 акаунтів (зараз ці акаунти видалені з соцмережі). Твіттер анонімізував акаунти, які мають менше 5 000 підписників, тому ми можемо побачити реальні назви лише 5% користувачів з бази. Останні можна класифікувати:

Найчастіше в описі самі власники акаунтів пишуть (тобто, ми не знаємо їх точні координати), що вони знаходяться в Москві (26%) та Санкт-Петербурзі (16%), а 17% не вказали місцезнаходження.

Піки активності

Перший твіт з вибірки датований січнем 2010 року, тому в нас є можливість проаналізувати активність «тролів» як до, так і після Революції Гідності.

До початку Революції гідності, у листопаді 2013-го і протягом наступних трьох місяців Україна майже не цікавила твітер-тролів: акаунти з нашої вибірки демонстрували дуже низьку активність. До весни 2014-го всі акаунти сумарно публікували в середньому 10 твітів на день, а максимальна кількість публікацій за цей період була 28 жовтня 2012 року, в день виборів до Верховної Ради, — 90 публікацій.

Позначку у 100 твітів на день перетнули на наступний день після «референдуму» в Криму — 17 березня 2014 року. В цей день акаунти опублікували 116 твітів, а 18 березня, в день анексії Росією півострова, — 129 твітів.

Більш плідно акаунти пов’язані з російською фабрикою тролей почали «працювати» за два дні до президентських виборів в Україні 2014 року — 263 твіти було опубліковано 23 травня. Наступні півроку кількість твітів не падала менше 115 на день.

Найбільша кількість твітів за вісім років припадає на 18 липня 2014 — наступний день після катастрофи літака MH-17. Тоді твіттер акаунти «натвітили» понад 44 тисячі повідомлень, а в наступний — понад 25 тисяч.

Промовистий хештег

Один з найбільш ефективних методів поширення твіту і, відповідно, потрапляння у тренди Твіттера — прописування хештегів. У нашій вибірці ми знайшли понад 6200 різних хештегів. Про що вони?

Найпопулярнішими хештегами в твітах про Україну стали #ПровокацияКиева (22,3 тис згадок), #КиевСбилБоинг (22,1 тис) та #КиевСкажиПравду (21,9 тис). Вони припали саме на дні після катастрофи MH-17 — 18-20 липня. В кампанії про просуванню цих хештегів брали участь 327 акаунтів. Зважаючи на те, що акаунти деперсоналізовані, спробуємо дослідити їх поведінку у період 18-20 липня 2014 року.

Хештег Кількість згадок
ПровокацияКиева22311
КиевСбилБоинг22104
КиевСкажиПравду21975
Украина20640
БитваОлигархов10004
новости8688
Россия8121
СекторБезГаза6882
Крым6089
КрымПутьНаРодину3000

Аккаунти-стахановці

Перше, що кидається в очі — кількість твітів з одного акаунту. Найбільш активний акаунт з вибірки за 18-19 липня (20-го не твітив) зробив сумарно 296 публікацій твітів та ретвітів. Як не дивно, схожих «стахановців» багато. Якщо зробити «рейтинг трудоголіків» 18-20 липня, то у нього увійдуть 277 акаунтів, які зробити 196 і більше публікацій за ці дні.

Чому ми зупинились на цифрі 196? Тому що розрив між кількістю твітів у №277 і №278 в рейтингу 155 публікацій. Тому ми продовжимо досліджувати 277 акаунтів.

Як вдалось одній людині зробити 296 публікацій за два дні? Для цього треба, як мінімум, бути дуже витривалою людиною — цей акаунт публікував твіти без великих перерв протягом 33 годин. В середньому кожен пост виходив кожні 6 хвилин та 42 секунди, а найбільша перерва між публікаціями була тільки 19 липня з 11:31 до 14:50. Як ми бачимо на візуалізації, понад 200 акаунтів працювали так само «ударно».

twitter-activity

Можна припустити, що одним акаунтом управляли кілька осіб. Одне з підтверджень цього — спосіб публікування твітів. Зазвичай, користувачі твітять безпосередньо з веб-сайту Твіттера або з мобільного додатку. Такі твіти в датасеті позначались «Twitter Web Client» та «Twitter for Android/iOS».

Публікувати твіти також можна за допомогою спеціального додатку — клієнт-сервісу. Це спеціальний сервіс для публікацій та управління одним або кількома акаунтами.

Для роботи з кількома акаунтами можна використовувати вже існуючі клієнт-сервіси або ж створити власний — Твіттер надає можливість розробникам публікувати, редагувати, видаляти та робити інші маніпуляції не з веб-сайту, а за допомогою API. Протягом липня спостерігається дивна активність кількох сервісів.

Наприклад, за допомогою програми для роботи з Твіттер «token_app» користувачі твітили лише протягом 7-19 липня 2014 року, а «twisofter» — протягом 16-19 липня. За допомогою останнього зробили найбільше публікацій саме 18 та 19 липня — 19,3 та 11,2 тис твітів (або 43% та 40% від загальної кількості у відповідний день).

«token-app» відстав не дуже сильно — 18,1 тис та 10,4 тис твітів (також 43% та 40% від загальної кількості у відповідний день) 18 та 19 липня відповідно. Жодної згадки про ці сервіси у пошукових системах не знайдено. Існує ймовірність, що ці клієнт-сервіси були створені лише під конкретного замовника або конкретну задачу і не промотувались на широкий загал, наприклад, як новий додаток.

Контент

55% твітів з майже 775 тис — унікальні, тобто не поширені (ретвітнуті) повідомлення з інших акаунтів.

На жаль, 98% ретвітів згенерували анонімні акаунти, тому ми не можемо дослідити хто саме поширював контент. Проте ми можемо проаналізувати, які сторінки ретвітили найбільш активно та який саме контент охоче поширювали.

Найбільше ретвітів на один пост зібрав користувач з ніком «_drBre» (нині видалений). Він є автором першого та другого (632 та 537 RT відповідно) за розповсюдженням твітів серед нашої вибірки. Третій в рейтингу -- «Письма на фронт» (@frontlineletter).

У Украинцев скачут даже ракеты! #украина #славаукраине #героямслава #тернополь https://t.co/aQQK0vy8jD http://t.co/JjIkwwLNhO

Власти Киева обязали магазины маркировать российские товары. Не потянитесь смотрите, за дедушкой Лениным http://t.co/e3u6E56nUR

Куда идти 1 сентября детям Донбасса? http://t.co/D19yDuYDvC

Сумарно найпопулярнішими джерелами ретвітів серед 1369 акаунтів були російські ЗМІ. На першому місці розташувались «РИА Новости» (23 тис ретвітів), на другому — «Федеральное агентство новостей» (16 тис) та замикає трійку лідерів «Russia Today» (14 тис).

Російські ЗМІ збирали не так багато ретвітів окремих постів. Наприклад, лідер за сумарною кількістю поширень, «РИА Новости», максимум мали 19 ретвітів на один пост. В 4 рази більше мало «Федеральное агентство новостей» — 80. Проте тут цікаві навіть не кількість ретвітів, лайків чи навіть контент. Час публікацій — ще одне підтвердження управління кількома акаунтами однією людиною.

18 з 19 акаунтів, які ретвітнули пост «РИА Новости» зробили це одночасно — о 16:25 28 вересня 2015 року. У «Федеральное агентство новостей» схожа ситуація: найпоширюваніший твіт (80 RT) публікувався 45 різними акаунтами о 16:34 17 липня 2014 і 35 іншими акаунтами о 16:43 того ж дня.

Висновки

Ми віримо, що слова мають силу, а ідеї – визначний вплив. VoxUkraine об’єднує найкращих економістів та допомагає їм доносити ідеї до десятків тисяч співвітчизників. Контент VoxUkraine безкоштовний (і завжди буде безкоштовним), ми не продаємо рекламу та не займаємось лобізмом. Щоб проводити більше досліджень, створювати нові впливові проекти та публікувати багато якісних статей, нам потрібні розумні люди і гроші. Люди є! Підтримай VoxUkraine. Разом ми зробимо більше!