«Хит-парад» вирусных новостей. Как медиа писали о COVID-19?

«Хит-парад» вирусных новостей. Как медиа писали о COVID-19?

29 сентября 2020
FacebookTwitterTelegram
5894

VoxUkraine проанализировал новостные ленты топовых украинских онлайн-СМИ и обнаружил, какие темы о Covid-19 преобладали в информационном пространстве. Больше всего СМИ писали о международной и украинской статистике ковида, карантинных мерах и состоянии медицинской системы страны. Наибольший интерес к коронавирусу был в марте, после этого количество новостей на эту тему неуклонно падает. 

В течение последних пяти месяцев каждая четвертая новость в украинских онлайн-СМИ касалась пандемии Covid-19. Темы этих новостей были очень разнообразны: международная статистика, темпы распространения вируса, описания симптомов и разработка вакцин. Почти ежедневно возникали новые сообщения об обнаружении вируса у публичных лиц, публикации о состоянии больниц, медицинских закупках и рекомендациях о соблюдении социальной дистанции. Большие объемы информации и перенасыщенность информпространства сообщениями о коронавирусе стали питательной средой для распространения мифов и фейков. С начала пандемии команда VoxCheck опровергла около 300 фейков о Covid-19. 

Коронавирус стал одним из основных инфоповодов, о котором ежедневно писали сотни новостей. Мы проанализировали 473 527 новостей крупнейших 27 онлайн-СМИ Украины в течение пяти месяцев: с февраля по июнь 2020-го включительно. Чтобы увидеть скрытую структуру за информационным шумом, мы применили алгоритм машинного обучения LDA для анализа больших наборов текстовой информации.

Вопрос терминологии

Большинство людей узнали о коронавирусе в начале года, когда появились новости о новом виде вируса. Этот вирус относится к группе коронавирусов, которые имеют похожий химический состав и образуют «корону» на гликопротеинах. 

Однако, СМИ сократили объяснения и назвали конкретный вирус именем всей группы. В результате такое название прижилось и стало наиболее широко применяемым в медиа. В нашем массиве упоминаний именно «короновируса» в теле статьи — 89%, а в заголовках — 80% (от всех текстов с упоминанием ковида/коронавируса/SARS и т.д.). 

Гораздо реже СМИ ссылаются на название болезни, вызывающей вирус, — Covid-19. Этот термин можно встретить в 10% текстов. В заголовках термин почти не употребляется (0,15% от всех заголовков текстов о вирусе).

Официальное название вируса — “SARS-CoV-2” — медиа почти не используют: 0,28% упоминаний в теле статьи и 0,15% в заголовках. 

Напалм новостей

Эпидемия вируса SARS-CoV-2 поглотила внимание общества. С начала пандемии и до конца июня почти четверть всех новостей (23% или 112,5 тыс. публикаций) касались коронавируса. 

Пик интереса к ковиду пришелся на март-апрель, когда в Украине обнаружили первый случай заболевания Covid-19 и ввели карантинные ограничения. По сравнению с февралем доля новостей с упоминанием коронавируса возросла втрое: с 11% до 37% (37 310 новостей в марте против 9 850 в феврале).

В апреле новостей с упоминанием ковида стало немного меньше — 32% (34 204 новости), но интерес к нему все еще держался — возможно, из-за обсуждения карантинных ограничений, которые продлевались несколько раз. 

За два месяца карантина общество устало не только соблюдать правила социальной дистанции, но и читать новости о коронавирусе. Так, в майских лентах сообщений о коронавирусе было 20% (19 655), а в июньских — 13% (11 387).

Основные темы о коронавирусе

27 онлайн-СМИ, попавшие в наш мониторинг, публиковали более 3 тысяч новостей в день на всевозможные темы, среди которых была и пандемия. Некоторые новостные сайты ежеминутно выпускают по 20-30 новостей. Конечно, человек не может успевать за всеми этими новостями. Однако с помощью алгоритма LDA из этих потоков информации можно выделить темы, которые повторялись чаще всего (рис. 1). Именно у таких тем есть шанс повлиять на общественное мнение о пандемии.

Рис.1 Распределение наиболее популярных тем по месяцам

Объяснение к графику: мы отобрали только наиболее популярные темы о Covid-19 и посмотрели их развитие во времени. Из графика видно, что о возникновении вируса и соблюдении карантина больше всего писали в апреле, а о карантинных ограничениях — в марте, когда их начали вводить. 

LDA — это вероятностная статистическая модель, генерализующая данные. Алгоритм LDA работает с каждым документом (в нашем случае это статья) в массиве данных и присваивает ему вероятность быть частью одной из тем. 

Мы отобрали шесть тем, на которые СМИ писали больше всего. Суммарно они составляют более половины (57%) всего массива новостей о коронавирусе. Далее опишем их по следующей структуре: что? (какие слова сформировали тему), где? (на каких медиа), когда? (период времени, когда тема звучала в СМИ чаще всего).

Международная статистика (тема 10)

В тему международной статистики по ковиду вошло больше всего статей (11% всех статей на тему коронавируса). Эту тему сгенерировали статьи-сообщения о новых случаях заражения и количестве смертей по всему миру. Это статьи о ходе эпидемии Covid-19 в странах, которые тогда были в лидерах по количеству инфицированных: США, Италия и Испания. В эту тему также вошли сообщения о количестве инфицированных за последние сутки, количестве смертей на тысячу населения и в мире в целом.

Эта тема сразу стала доминировать в инфопространстве: в феврале о ней вышло 2 160 статей, в марте уже 3 779, в апреле 3 126. В мае интерес к ней утих (2 030) и продолжил падать в июне (1 718).

Карантин для всех (тема 2)

Карантинные ограничения в Украине обсуждались в медиа почти так же часто — 8,03% всех статей о коронавирусе. Больше всего они обсуждались в марте (2 993 новости) и апреле (2 446 новостей), когда карантин был наиболее строгим. В эту тему вошли сообщения о карантинных мерах, их соблюдении или нарушении, усилении ограничений в отдельных областях. Также это сообщения о введении чрезвычайного положения, правилах посещения публичных мест, ограничении движения транспорта. Несколько примеров публикаций: Дезинфекция улиц и остановок: как Киев борется с коронавирусом, На Луганщине решили ослабить карантин несмотря на небольшое количество сделанных тестов, На Винничине усилили карантин: возобновили работу пяти круглосуточных постов.

Региональная статистика (тема 5)

В эту тему вошло 7,87% всех статей с упоминанием коронавируса — все, что касается темпов распространения вируса внутри страны, статистики заболеваемости по регионам и районам. Это новости с заголовками вроде На Одещине количество больных COVID-19 выросло на 20 человек, всего — 93 зараженных, На Буковине новым коронавирусом заразились еще 56 человек. Больше всего таких новостей было в апреле — (3 396).

Медицинская система (тема 17)

О состоянии медицинской системы, заполненности больниц, медицинских закупках и деятельности МЗ опубликовано 7,3% новостей, касающихся коронавируса. Например, сюда вошли статьи о темпах заболеваемости среди медиков, сообщения и комментарии работников медицинской сферы. Эту тему сформировали все статьи, касающиеся обсуждения пандемии Covid-19 через призму медицинской системы. Больше всего публикаций на эту тему было в марте (3 964) и апреле (2 278).

Карантин для каждого (тема 7)

Статьи этой темы освещают жизнь на карантине с позиции рядового гражданина. Они составляют 6,6% всех статей о коронавирусе. В эту тему вошли рекомендации о том, как адаптироваться к карантинным ограничениям, напоминание о социальной дистанции, объяснения относительно усиленных мер личной гигиены. Также в нее вошли публикации о нарушении карантинного режима (В США мэр города приказал полиции ловить всех нарушителей карантина: арестовали его жену), советы (Как сформировать график ребенка на время карантина: советы психологини, Карантин из-за коронавируса: список музеев, которые можно «посетить» онлайн). Наиболее актуальными такие статьи были в марте и апреле, тогда их вышло наибольшее количество: 2 610 и 2 885.

Интересное о коронавирусе (тема 19)

Эта тема является второй по количеству статей в ней, — она ​​включает в себя 10% всех новостей о коронавирусе. Однако мы поместили ее в конец списка, поскольку представлена ​​она лишь несколькими медиа. Алгоритм объединил статьи в эту тему, поскольку большинство из них написаны на русском языке, а большие объемы темы объясняются производительностью ресурсов, сформировавших ее (в частности — Страна.юа и Цензор.Нет). По существу тема довольно широка: ее сформировали статьи, объясняющие происхождение вируса SARS-CoV-2, карантинные ограничения в разных странах и государственные меры противодействия распространению ковида. Многие новости в ней основываются на комментариях представителей МЗ и первых лиц государства. Также в эту тему входят объяснения относительно функционирования общества во время карантина. Типичными для нее являются такие заголовки: Медики выяснили влияние коронавируса на первые недели беременности, США увеличивают помощь Украине на борьбу с COVID-19 до $14,5 млн, Распространение коронавируса: как в разных странах борются с эпидемией. То есть это достаточно широкая тема, цель которой — объяснить ситуацию вокруг коронавируса. Больше всего статей этой темы вышло в апреле (4 006) и марте (3 294). 

В течение рассматриваемого периода «хит-парад» коронавирусных тем не менялся — это международная и региональная статистика, карантинные ограничения, правила социальной дистанции и государственные меры противодействия ковиду. И хотя со временем интерес к новостям о Covid-19 падает, относительная популярность этих тем остается неизменной.

Кто пишет о Covid-19 больше всего?

Рис.2 Доля новостей о короне в лентах топ-медиа 

Источник: собственные расчеты. СМИ отсортированы по доле новостей о коронавирусе в общем объеме новостей

Существует несколько моделей, с помощью которых СМИ рассказывают об эпидемии Covid-19. Кто-то создает отдельные дайджесты, некоторые — страницы отслеживания статистики онлайн и тематические разделы. Существуют и такие медиа, которые только иногда упоминают о вирусе в статьях. 

О Covid-19 относительно больше пишут те сайты, которые публикуют не очень большое количество новостей (в среднем по 2 503 новости в месяц). В тройке лидеров по количеству статей с упоминанием Covid-19 — сайт Гордон.юа (35% всех новостей ресурса), Цензор.Нет (34%), Громадське (33%) и Украинская правда (32%). Первые два медиа создали отдельные ковид-разделы, УП развернула страницу со статистикой, а сайт Громадського тему с Covid-19 не выделил. 

В противовес этим новостным сайтам, два портала из нашего списка с наибольшим количеством опубликованных новостей в день — Politeka и Знай — почти не упоминали в своих лентах коронавирус. У Politeka упоминаний ковида меньше всего — 6% от всех новостей сайта, а у Знай — 9,5%. Портал с самым большим общим количеством новостей за пять месяцев — 24 канал — также упоминает Covid-19 только в 9,5% новостей.

Любимые темы медиа

В нашу базу вошли новостные ленты онлайн-СМИ с различными моделями подачи новостей. Например, такие сайты как 112, Знай, 24 канал, Politeka публикуют по 20-30 новостей в минуту. Качественные СМИ, такие как Лига, Радио Свобода или Фокус, публикуют в разы меньше контента — в среднем по 57 новостей в сутки. Рис. 3 показывает, как топовые темы о Covid-19, описанные выше распределены по медиа. Есть ли в отдельных СМИ темы, которые они продвигают наиболее активно?

Рис.3. Распределение публикаций, связанных с коронавирусом, по темам

Объяснение к графику: График показывает, какую долю новостей о коронавирусе занимали новости на определенную тему на каждом сайте. Отдельно выделено 6 топ-тем, которые описаны выше, «другие категории» включают остальные 14 тем, выделенных алгоритмом.

Тема Международной статистики распространения Covid-19 освещалась всеми медиа одинаково много. Более того: для половины медиа (14 из 27) эта тема является одной из самых обсуждаемых. Доли статей каждого медиа на эту тему среди «ковидних» статей примерно одинаковы и составляют в среднем 19% новостей за пять месяцев. 

Тема Карантин для всех наиболее активно продвигалась теми СМИ, которые в целом не много писали о коронавирусе. К примеру, на Экономической правде только 9% статей касались коронавируса. Однако в 13% статей о коронавирусе говорилось о карантинных ограничениях. Много внимания этой теме уделяло Радио Свобода, которое о ковиде писало в 30% новостей. Доля статей о карантинных ограничениях здесь составляла 6% от всех публикаций о Covid-19. На Зеркале недели за рассмотренные 5 месяцев 30% статей касались ковида, но доля о карантине для всех среди них — 12%. 

Зеркальная предыдущей тема — Карантин для каждого — описывает правила социальной дистанции и личной гигиены во время пандемии. Об индивидуальном соблюдении карантина больше всех писали Апостроф (49% статей о ковиде), Знай (36%) и Politeka (37% статей). 

Темы Медицинской системы и Региональной статистики освещались онлайн-СМИ почти равномерно, если не брать во внимание новости русскоязычных СМИ. Состояние медицинской системы обсуждалось в новостях в среднем в 13% случаев, а о Региональной статистике СМИ писали в 14% публикаций. 

В общую картину не вошли статьи русскоязычных СМИ, поскольку их публикации алгоритм объединил в отдельную тему — Интересное о коронавирусе (рус.). Эта тема является одной из крупнейших во всем массиве, однако сформировали ее всего несколько русскоязычных медиа: Страна (3183 новостей), Лига (984 новостей), Украньюз (1768 новостей), Левый берег (1077 новостей), Цензор.Нет (2553 новостей), Фокус (1707 новостей).

Выводы

  1. За период с начала пандемии до конца июня каждая четвертая новость касалась Covid-19: 112 513 новостей из 473 527 публикаций. 
  2. Больше всего о Covid-19 писали в марте (37 310 новостей) и апреле (34 204 новостей). Меньше всего — в феврале (9 850).
  3. Среди 27 топ-медиа относительно больше новостей о ковиде писали Гордон (35% новостей), Цензор.Нет (34%) и hromadske (33%).
  4. Наиболее распространенными темами были Международная статистика (12 222 новостей), Карантин для всех (9 031 новость), Региональная статистика (8 852), Состояние медицинской системы (8 217 новостей), Карантин для каждого (7 424 новости).
  5. Единственная тема, равномерно освещенная всеми медиа — Международная статистика. Она наиболее популярна для 14 из 27 медиа. Есть темы, которые развивали только отдельные СМИ: о Карантине для каждого активнее всего писали Апостроф, Politeka и Знай, а о региональной статистике коронавируса — УНН и Интерфакс.

Как мы считали

Мы собирали новости с сайтов наиболее популярных украинских СМИ. В определении популярности медиа мы опирались на рейтинги компании TNS GROUP, Интернет Ассоциации Украины, исследования USAID-Internews и мониторинги Детектор медиа. Опираясь на данные этих исследований, мы сформировали список из наиболее популярных онлайн-СМИ. В этот анализ вошли новостные ленты 27 онлайн-СМИ:

112 канал Еспресо РБК-Украина ФАКТИ ictv
24 канал Интерфакс Сегодня ФОКУС
Апостроф ЛИГА ТСН Цензор.Нет
Гордон Левый берег Украинские новости ZIK
Громадське ТБ Обозреватель УНИАН Знай
Зеркало недели Politeka УНН Страна
Экономическая правда Радио Свобода УП

**К сожалению, НВ не попало в нашу выборку из-за технических ограничений, хотя это СМИ занимает первые места в рейтингах**

Мы собрали новости с сайтов наиболее популярных украинских медиа, среди них отобрали новости о коронавирусе и посмотрели, какие темы о пандемии громче всего звучали в СМИ. 

За период с февраля по июль украинские онлайн-СМИ опубликовали более 470 тысяч текстовых новостей. Чтобы определить, что и как в них писали о ковиде, мы почистили новостные статьи от невалидного текста, который мог повлиять на финальную обработку: удалили ссылки, теги, комментарии под статьями и ссылки типа «читайте также» и другие. Затем мы отобрали только те публикации, в которых Covid-19 упоминался не менее трех раз. Таких новостей оказалось 112 513. 

На этом массиве мы применили алгоритм машинного обучения LatentDirichletAllocation (LDA). С его помощью мы определили, какие темы чаще всего встречались в статьях о коронавирусе в украинских онлайн-СМИ в течение пяти месяцев пандемии. LDA ищет скрытые структуры в больших наборах текстов. С его помощью мы можем «уменьшить размерность» массива и увидеть наиболее значимые месседжи в нем.

Дисклеймер. Эта статья опубликована в рамках Программы содействия общественной активности «Долучайся!», финансируемой Агентством США по международному развитию (USAID) и осуществляемой Pact в Украине. Содержание статьи является исключительной ответственностью Pact и его партнеров и не обязательно отражает взгляды Агентства США по международному развитию (USAID) или правительства США.

Авторы

Предостережение

Автор не является сотрудником, не консультирует, не владеет акциями и не получает финансирования ни от одной компании или организации, которая имела бы пользу от этой статьи, а также никак с ними не связан.