Як часто ви помічали, що сьогодні всі обговорюють певну історію, а вже завтра про неї забувають і переключаються на щось інше? Як часто ви дивувалися, чому всі обговорюють саме цю подію, адже є важливіші? У цьому матеріалі ми аналізуємо інформаційне поле березня 2021 та з’ясовуємо, які події стають хайповими та скільки тривають окремі інформаційні приводи.
Дисклеймер: Статтю підготовлено в рамках проекту «Медіа Екосистема» за підтримки US Embassy. В цьому проекті ми досліджуємо український медійний простір, аналізуємо новини найпопулярніших онлайн-ЗМІ, щоб надавати актуальну агреговану інформацію про теми, меседжі та зв’язки між медіа.
Як ми шукали інфоприводи?
Під інфоприводами ми маємо на увазі подію чи декілька пов’язаних подій, які мали значне висвітлення у ЗМІ – наприклад, акції на підтримку Стерненка чи перекриття Суецького каналу. Також інфоприводом може бути підтема великої теми – наприклад, «ситуація в Криму» в темі «політика», «побічні реакції на вакцини» в темі «коронавірус».
Для аналізу ми взяли новини 42 популярних українських медіа за березень (162 382 новини). Матеріали класифікували на 15 тем. Топ-5 тем за кількістю новин виявилися політика, інциденти, коронавірус, економіка та шоубізнес. Саме серед цих топ-тем ми й шукали інфоприводи, попередньо замінивши «шоубізнес» темою «світ», яка йде наступною за кількістю новин і для нас є цікавішою.
На новинах цих тем ми запустили алгоритм LDA, який розділив кожну тему на 40 топіків-інфоприводів (тобто всього 200 інфоприводів). Серед цих 200 інфоприводів ми відібрали по три в кожній «великій» темі (тобто всього 15) для детального дослідження (рис. 1). Критерії відбору інфоприводів були такі: по-перше, кількість новин у певному інфоприводі. По-друге, важливість цього інфоприводу визначена експертною думкою команди DataVox. Наприклад, у підтемі «курс гривні» було дуже багато новин – адже новини на цю тему щоденно публікує велика кількість сайтів. Проте рух курсу в один чи інший бік на кілька копійок не є цікавою темою для аналізу.
Джерело: власні розрахунки. Примітка: розмір бульбашки пропорційний кількості новин у певному інфоприводі
Протягом місяця новини інфоприводу могли лише час від часу з’являтися в інфополі, а могли перебувати в полі зору ЗМІ переважну частину місяця. Тому для аналізу тривалості інфоприводу ми взяли лише пікові проміжки часу — тобто ті дні, коли тема користувалася підвищеною увагою ЗМІ. Ці проміжки ми визначили за допомогою ковзного середнього кількості новин інфоприводу за 12 годин, який використали для того, щоб згладити розподіл новин інфоприводу в часі. Іншими словами, ми врахували те, що медіа не працюють цілодобово, і що об 11.00 більше новин, ніж о 23.00, просто тому, що це день (докладніше у методології наприкінці статті).
На сайті mediaecosystem.org ви можете знайти топ-5 тем за місяць у 42 медіа, найбільші інфоприводи, згадки політиків та емоційне забарвлення новин зі згадками політиків, експертів, яких найчастіше запрошують коментувати новини, мережу ЗМІ та не завжди очевидні зв’язки між ними.
Топ-7 інфоприводів за кількістю новин
Тема коронавірусу не перестає бути актуальною. В березні значна увага була прикута до щеплень Astrazenec’ою, коли з’явилася велика кількість новин про побічні реакції на вакцину та призупинення/відновлення вакцинації у різних країнах.
Докладніше про побічні реакції на вакцини читайте у поясненні від VoxCheck.
Цей інфопривід був у фокусі уваги безперервно протягом 10 днів, з 11 по 21 березня. У цей період новини про нього склали 1,31% всіх новин у 42 досліджених ЗМІ.
Найбільше у висвітленні цього інфоприводу брало учать НВ — 63 новини протягом березня стосувалися вакцинації (рис. 2). Також багато писали про нього РБК-Україна (55) та Укрінформ (46). Не цікавила ця тема Znaj.ua, Politeka та Факти (лише від 0 до 3 новин).*
Ситуації в Криму ЗМІ також приділяють багато уваги. Протягом березня вони писали про арешт журналіста «Радіо Свобода» в Криму, санкції накладені на Росію через анексію, Кримську платформу, указ Путіна про заборону володіння землею українцям у Криму, водну блокаду, сім років «референдуму» та загалом про окупацію/деокупацію. Обговорення таких тем триває доволі довго – чотири із семи періодів підвищеної уваги до ситуації в Криму тривали від 3 до 6 днів. Під час такої «пікової» уваги до теми Криму ЗМІ присвячували їй в середньому 0,67% своїх новин.
Найбільше про Крим писали Укрінформ – 66 новин за місяць, 24 канал та Obozrevatel – по 60. Найменша* кількість матеріалів про Крим була у стрічках Znaj.ua, Голос та Вголос – від 2 до 4.
Санкції Медведчуку ставали топ-темою політичних новин сім разів, переважно на 1-2 дні. Частка інфоприводу серед усіх новин під час пікових періодів коливалася від 0,55% до 1,26%.
Найбільше у березні писали про цю тему, зрозуміло, ЗМІ, пов’язані з Медведчуком: 112.ua (81 новина) та ZIK (89). Замикають трійку 24 канал та НВ, які присвятили санкціям по 49 новин. Найменше* ця тема цікавила Znaj.ua, Вголос та Факти ICTV (по 2 новини).
До категорії «інциденти», як і до «політики», потрапили новини, пов’язані з акцією за Стерненка 20 березня. Це переважно статті про затримання учасників акції, визначення їм запобіжних заходів, інші новини із судів і т.п. Відповідно до нашого класифікатора такі новини потрапляють саме до категорії «інциденти». До «політики» ж алгоритм відніс переважно коментарі політиків про акцію, новини про позачергове засідання Ради присвячене протесту, двері у студії 1+1, відмивання та ремонт ОП. Категорії у нашому класифікаторі не перетинаються, тобто одна новина не могла бути одночасно в інцидентах та політиці.
В темі «інциденти» акція за Стерненка мала лише один пік, який тривав понад 6 днів. При цьому він зайняв у інфополі одну з найбільших часток – 1,81% усіх новин за цей період.
Найчастіше ця тема зустрічалася у НВ – 42 їхніх новини за місяць стосувалися акції 20 березня. По 39 новин про неї розмістили Букви та УНІАН. Максимально оминали* тему Politeka, Znaj.ua та Вголос (від 0 до 3 новин).
Серед політичних новин акція за Стерненка отримала три «хвилі» уваги, які тривали від 1,4 до 3,6 днів. Перша хвиля почалася в день основної події інфоприводу — протесту 20 березня, через приблизно пів години після оголошення про завершення акції, і закінчилася 24 березня. Під час цього піку 2,12% усіх новин стосувалися цієї теми (це найбільший показник із 15 розглянутих інфоприводів). Під час другої хвилі не можна виділити центральну подію, однак близько 25% новин інфоприводу займало обговорення перформансу з дверима на 1+1. Центральною подією третього сплеску цікавості до цієї теми було позачергове засідання парламенту для засудження протесту.
До топ-3 медіа, які найчастіше брали участь у висвітленні акції 20 березня, входять 24 канал (43 новини за місяць), Гордон (39) та Цензор.НЕТ (38). Politeka взагалі не поширювала новини про цей інфопривід, на Вголосі відповідних статей було 2, а на Znaj.ua – 3*.
Тема тарифів мала найбільшу кількість піків – 8, які в середньому тривали по 1,5 дні. Новини переважно стосувалися ціни на газ за березень і квітень, річного тарифу на газ, продовження терміну встановлення газових лічильників, тарифу на електроенергію, боргів та ін. Максимально ця тема займала 1,07% в новинному інфополі.
Серед окремих медіа найбільше уваги тарифам приділили Главком та Obozrevatel (по 48 новин протягом березня), а також Українські новини (43). Найменше* – Українська правда – 0 матеріалів (ймовірно через наявність дочірнього профільного медіа – Економічної правди), Букви (3) та Zaxid.net (4).
Тема ДТП з українцями у Польщі 5 березня при єдиному піку зберігалася в інфополі 5 днів, а частка новин про неї в цей період становила 2,01%.
Новини про цей інфопривід найчастіше у березні публікували 24 канал та Gazeta.ua (по 40) і НВ (34). Найрідше* це робили Бабель, Факти і Фокус – від 1 до 3 новин.
Решта 8 інфоприводів мають малу кількість новин для аналізу в розрізі медіа.
Джерело: власні розрахунки. Розподіл по усіх 42 ЗМІ можна подивитися у таблиці з даними.
* До порівняння в цьому розділі не потрапили Економічна правда та Суспільне, оскільки перше медіа має економічний профіль та практично не пише на інші теми, а у Суспільного до зібраних із сайту матеріалів потрапляють новини регіональних філій – це спотворює порівняння.
Наскільки інфоприводи заповнюють інфополе у періоди пікових значень?
В середньому інфопривід протягом «злету» заповнює 0,87% інфополя (рис. 3). Найбільшу увагу ЗМІ привернув один із піків акції за Стерненка (2,12% усіх новин за період злету). Найменший пік, із протестів у М’янмі, досяг лише 0,27% усіх новин за цей період.
Джерело: власні розрахунки
Примітка: новини про блокування Суецього каналу, як і акція за Стерненка, могли потрапити до двох категорій – або «економіки», або «світу». До першої потрапили новини про вплив події на світову економіку, до другої — загальні новини про ситуацію в каналі.
Тривалість життя інфоприводів
Як довго проаналізовані інфоприводи «живуть» у ЗМІ? Розглянемо тривалість пікових періодів (рис. 4-5).
Отже, найдовший пік тривав 9,6 днів – у темі «призупинення та відновлення вакцинації Astrazenec’ою», найкоротший — 0,2 дні, у справи Шеремета-Антоненка.
В середньому (медіана) ЗМІ приділяють інфоприводу 1,4 дні. Лише третина «сплесків» уваги до інфоприводів тривали понад 2 дні.
Джерело: власні розрахунки
Агреговані дані для статті можна подивитися за посиланням.
Висновки:
- Із п’яти найпопулярніших категорій новин ми виділили по три найбільш популярні та цікаві інфоприводи й детально розглянули ці 15 інфоприводів (подій чи вузьких тем). Загальна кількість новин у інфоприводах становить 7602, тобто 4,7% із 162 382 «березневих» новин.
- Для інфоприводів характерні пікові періоди, під час яких кількість присвячених їм новин значно зростає. Піків може бути декілька для одного інфоприводу. В середньому під час підвищеної уваги до інфоприводу медіа присвячують йому 0,87% новин.
- Із розглянутих інфоприводів найвищий «пік» був у акції протесту за Стерненка – онлайн-ЗМІ присвятили цій події 2,12% новин. Найменш помітною була хвиля новин про протести у М’янмі – лише 0,27% новин.
- Медіанна тривалість сплеску уваги до інфоприводу – 1,4 дні. Лише третина інфоприводів користуються підвищеною увагою медіа довше двох днів. Найдовше тривав пік теми про призупинення/відновлення вакцинації Astrazenec’ою – 9,6 днів. Найкоротший сплеск уваги ЗМІ був у справи Шеремета-Антоненка – 0,2 дня.
- Далеко не всі медіа вважають «хайповими» одні й ті самі теми. Наприклад, Politeka, Znaj.ua чи ZIK опублікували про найпопулярніший інфопривід за місяць – акцію за Стерненка – до трьох новин, тоді як на 24 каналі, Гордоні чи Цензор.НЕТ таких новин було близько 40. Можливо, це пов’язано зі спеціалізацією медіа – оскільки ми розглядали лише суспільно-політичні теми, природно, що про них більше писали ЗМІ, які можна назвати суспільно-політичними. Водночас можна припустити, що люди, які дізнаються більшість новин, наприклад, із сайту Znaj.ua, практично не отримують інформації про важливі новини з життя країни. Це свідчить про значну фрагментованість українського медіаполя.
Методологія
Для дослідження ми сформували список українських онлайн-медіа взявши за основу відкриті рейтинги Інтернет Асоціації України, Gemius, Kantar, дані Similar web, дослідження USAID-Internews, моніторингів Інституту масової інформації та Детектор медіа.
Ми додаємо медіа до моніторингу враховуючи такі фактори: позиція медіа у рейтингах та дослідженнях наведених вище, технічні можливості збору даних, оцінки релевантності медіа від редакційної колегії та нас як дослідників.
Таким чином ми відібрали 42 популярних українських ЗМІ.
Усі новини за березень ми класифікували на 15 тем. Докладніше про алгоритм класифікації читайте в одній із попередніх статей.
Новини п’яти тем (політика, інциденти, коронавірус, економіка та світ «шоу-бізнес» стоїть вище «світу» за кількістю новин, проте для нас він не дуже цікавий) для української та російської мов ми розбили на 40 топіків за допомогою алгоритму LDA. Після цього ми виокремили серед 40 топіків 15 інфоприводів, які нас найбільше цікавлять, та вручну звели результати для двох мов між собою. При відборі інфоприводів для аналізу ми враховували кількість новин інфоприводу та його важливість.
Новини у виділених топіках ми відфільтрували від тих, які не стосувалися інфоприводу але яких було багато (наприклад, в інфопривід про допомогу ФОПам потрапило багато новин про тарифи Укрпошти – ми видалили їх із масиву). За особливістю роботи LDA до одного топіку могли потрапити кілька інфоприводів – тому ми позбулися зайвих.
Щоб знайти пікові періоди інфоприводу, ми використали ковзне середнє. Спершу відсортували новини інфоприводу за часом. Далі для кожної новини порахували кількість новин цього інфоприводу за 12 годин до цієї новини (таблиця 1, стовпчик «кількість новин»). Після цього розрахували ковзне середнє – для кожної новини визначили середнє значення поля «кількість новин» за попередні 12 годин (стовпчик «ковзне середнє»).
Мінімальна кількість новин, яка мала бути у 12-годинному вікні для показника «кількість новин» – 4, інакше значення поля дорівнювало NaN (тобто у цій ситуації – нулю, але такі значення відкидалися при розрахунку середньоарифметичного). У випадку з «ковзним середнім» за 12-годинний період мало бути щонайменше 4 новини зі значенням «кількість новин» не NaN.
Ми використали метод ковзного середнього, щоб згладити розподіл новин інфоприводу на часовій осі.
Значення ковзного середнього, грубо кажучи, показують ту кількість новин, яку медіа публікували би за 12-годинний проміжок, якби робили це рівномірно.
Не враховувалися часові злети інфоприводу, якщо максимальне значення ковзного середнього у них не перевищувало середнього значення протягом місяця у цього ж інфоприводу. У акції за Стерненка в категорії «політика» один пік був розбитий на два, оскільки у період близько двох днів спостерігалися достатньо малі значення (нижче 30% від середнього значення ковзного середнього у інфоприводі) для врахування в аналізі. Тому цей проміжок часу був видалений.
12-годинний проміжок був вибраний після тестування різних значень: при менших проміжках утворювалося багато піків, хоча між ними був невеликий часовий проміжок, а при більших — навпаки, піки могли об’єднуватися, хоча між ними був великий часовий проміжок. Тому ми вирішили обрати пів доби для ковзного середнього. З точки зору загального розуміння це можна пояснити так: 12-годинний проміжок охоплює робочий один день. А якщо певна подія трапилася ввечері й про неї продовжили писати наступного ранку (тобто після перерви на ніч) – це буде продовження тієї самої інформаційної хвилі, а не початок наступної.
Застереження
Автор не є співробітником, не консультує, не володіє акціями та не отримує фінансування від жодної компанії чи організації, яка б мала користь від цієї статті, а також жодним чином з ними не пов’язаний