Фальсификация парламентских выборов в 2014 году (о чистоте выборов)

Пожалуй, наиболее распространенная форма фальсификации заключается в бросании бюллетеней за партию

Svopi.ru

Авторы:

26 октября 2014 года, в Украине проводились досрочные выборы в Верховную Раду, украинский парламент. Главной целью досрочных выборов было восстановить легитимность парламента после того,  как уходящие в отставку члены Парламента проголосовали за так называемые диктаторские законы 16 января 2014. Легитимность новоизбранного парламента зависит от честности выборов. Не смотря на то, что ряд авторитетных организаций, таких как ОБСЕ, сообщили об отсутствии мошенничества на выборах, слухи о фальсификации выборов продолжают распространяться в СМИ.

В этой статье с помощью статистических методов мы оцениваем, имеют ли основания эти слухи.

В частности, мы используем три статистических метода для идентификации каких либо нарушений связанных с фальсификацией выборов. Результаты не подтвердили тот факт, что мошенничество имело место, но кое-какие сомнения остались, что оставляет вопрос незакрытым для дальнейших исследований. Поскольку данные трудно интерпретировать  абсолютном смысле — мы используем Парламентские выборы 2012 в качестве ориентира в нашем исследовании, так как их результаты были сомнительными.

Метод #1. Явка избирателей и процент проголосовавших за партию

Пожалуй, наиболее распространенная форма фальсификации заключается в бросании бюллетеней за партию. Смысл этого «трюка» заключается в том, чтобы увидеть соотношение между явкой избирателей и процентом голосов за определенную партию. Однако трудно объяснить их соотношение, когда распределение избирателей и их активность не являются случайностью. Например, люди в области А могут быть более активными, чем люди в области В. Ми будем наблюдать корреляцию между явкой избирателей и процентом голосов за партию Y  в той же степени, в которой  большинство людей в области А поддерживают партию Х, а не партию Y, более популярную в области В.  Для контроля такого соотношения в разных областях используется формула для регрессивного анализа:

regression.png 943×196

где p, r, s — индексы партии, области (мы используем окружные избирательные комиссии) и избирательного участка,  – процент голосов за партию р на избирательном участке s, в области r,  – явка избирателей на участке s, в области r . Константа сr — индивидуальна для каждой области и вмещает все особенности этого региона. Если нет фальсификации — то число b будет близко к нулю.

Мы видим общую картину по результату регрессионного анализа на данных парламентских выборов 2012 и 2014гг. Для выборов 2012 года прослеживается положительная связь между явкой избирателей и долей людей проголосовавших за Партию регионов — победителя выборов 2012 года – партию одиозного Виктора Януковича. В частности, оценивая результат b можно сказать, что повышение явки избирателей на 1% связано с повышением доли людей проголосовавших за Партию Регионов на 0.24%. Мы исключаем тот факт, что это случайно. Число b для всех других партий, за исключением Свободы, отрицательно. Этот результат подтверждает то, что Партия регионов «воровала» голоса у других партий. Обратите внимание, что этот коэффициент в коммунистической партии является наиболее негативным и это означает, что Коммунистическая партия наиболее пострадали от таких «краж».

В отличие от этого, между количеством голосов за Народный фронт, победителя  выборов  2014 года, и явкой избирателей дисбаланса не обнаружено. Блок Порошенко, вторая самая популярная партия на выборах 2014, имеет несоответствие между количеством голосов отданных за эту партию и явкой избирателей. Этот факт настораживает, но это всего ничего в сравнении с тем, что наблюдалось с голосами за Партию регионов в 2012 году.  Более того, за БПП проголосовали более чем в 5 раз меньше, чем за Партию регионов. Общие результаты выборов 2014 года показывают, что случаев фальсификации было гораздо меньше, чем в 2012 году.

Таблица1. Результаты регрессионного анализа

Список A: выборы 2012

Партия регионов Блок Тимошенко Удар Коммунистическая партия Свобода
(1) (2) (3) (4) (5)
Явка избирателей 0.244*** -0.062*** -0.065*** -0.115*** 0.025***
(0.020) (0.012) (0.006) (0.009) (0.008)
Результаты 33,474 33,474 33,474 33,474 33,474

 

 

Список B: выборы 2014

Народный фронт Блок Порошенко Самопомощь Оппозиционный блок Радикальная партия Батькивщина (Тимошенко) Свобода
(1) (2) (4) (5) (6) (7) (8)
Явка избирателей 0.003 0.049*** -0.006 -0.028*** -0.016*** 0.020*** -0.003
(0.008) (0.015) (0.004) (0.008) (0.005) (0.005) (0.003)
Результаты 29,497 29,497 29,497 29,497 29,497 29,497 29,497

Примечание: Зависимая переменная — количество голосов за партию, обозначенную в первой строке каждого столбца таблицы. Стандартные погрешности сгруппированы по областям (окружные избирательные комиссии). ***, **, * обозначают статистическую значимость на уровне 10, 5, и 1 процентов соответственно.

Метод # 2. Явка избирателей и влияние «экстремальных участков»

Фальсификация, вероятно, будет сосредоточена на относительно небольшом количестве участков, но эти участки могут принести значительное число голосов в национальном масштабе. Подозрительно, если большая часть голосов за определенную партию приходит от небольших избирательных участков с высокой явкой. Очевидно, что некоторые избирательные участки могут иметь высокую явку избирателей, но статистически, они не должны составлять большой, или даже значимый процент, в общем количестве голосов за определенную партию. Интуиция подсказывает, что, статистически, высокая явка избирателей вполне возможна на участках с небольшим количеством зарегистрированных избирателей, но это маловероятно для участков с большим количеством избирателей. Например, если на участке зарегистрировано 5 избирателей, то  вполне можно ожидать, что все 5 придут на выборы и проголосуют. Но при 10 000 потенциальных избирателей, крайне маловероятно, что все 10000 придут голосовать.

Один из способов обнаружить такое несоответствие —  изучить совокупный вклад избирательных участков как функцию от явки избирателей. Если все честно, то с приближением явки к 100 процентам, количество голосов за каждую отдельно взятую партию должно сглаживаться. Другими словами, плоская часть обобщенного распределения – это сигнал того, что эти «экстремальные» избирательные участки не имеют никакого эффекта на результаты на национальном уровне. С другой стороны, если количество голосов за конкретную партию вместе с явкой избирателей будет 100%-ыми – то это уже повод для волнения: эти избирательные участки отличаются не просто статистически маловероятными изгибами, но и нетипичной концентрацией голосов у данной партии

На рисунке 1 показано обобщенное распределение голосов для следующих политических сил: Партия регионов в 2012 году, Народный фронт в 2014 году, и Блок Петра Порошенка в 2014 году. Отметим, что для последних двух партий кривые выглядят плоскими где-то после отметки 90% явки избирателей. В отличие от этого, кривая Партии регионов продолжает расти вплоть до 100%. Это явно свидетельствует о потенциальной фальсификации: на крупных участках, избиратели были необычайно активны, и в то же время там наблюдается сильный перекос в пользу Партии регионов. Таким образом, если сравнивать выборы 2014 с выборами 2012 года — то фактов фальсификации в 2014 году меньше.

Рисунок 1. Вклад экстремальных избирательных участков

 

Примечание: горизонтальная ось показывает явку избирателей. Вертикальная ось показывает совокупный вклад избирательных участков с явкой более низкой, чем указано на горизонтальной оси по отношению к общему количеству голосов.

Метод # 3. Закон Бенфорда

Примерно в 1938г физик Фрэнк Бенфорд обнаружил, что распределение первых цифр в реальных данных можно описать простым соотношением. В частности, примерно в 30% случаев, первая цифра в реальных данных равна «1»; в 18% случаев — первая цифра «2», и так далее. Эта связь была названа законом Бенфорда. Хэл Вариан, известный экономист (сейчас главный экономист Google) и бывший коллега одного из авторов, сказал, что закон может быть использован для обнаружения фальсификации выборов. В частности, если та или иная партия получает количество голосов больше чем обычно, нарушается закон Бенфорда, поэтому следует быть более внимательным к этим областям. Интуитивно понятно, что нарушители на избирательных участках не предполагают, что из манипуляции меняют распределение агрегированных данных и делают его несовместим с законом Бенфорда.

Рисунок 2 показывает распределение первых цифр по закону Бенфорда (черная линия) и распределения для Партии регионов в 2012 (синяя линия с квадратами) и суммы голосов для Народного фронта и блока Порошенко в 2014 (красная линия с кружками). Обратите внимание, что красная линия близка к черной линии, которая соответствует минимальной манипуляции результатам выборов. С другой стороны, синяя линия отходит отчетливо от черной линии. В частности, существует слишком много «​​1», «7» , «8» , «9», и слишком мало «2» с «3» и «4» . Хотя трудно объяснить эти цифры сами по себе, отклонения от закона Бенфорда в 2012 было явно больше, чем в 2014, что позволяет предположить, что масштабы фальсификации выборов в 2014 были значительно меньше, чем на выборах 2012 года.

Рисунок 2. Закон Бенфорда

Примечание: горизонтальная ось показывает первую цифру номера бюллетеня на избирательных участках. Синяя линия показывает распределение цифр для избирательных участков (выборы 2012), где Партия регионов получила количество голосов более высокое, чем среднее. Красная линия показывает распределение цифр для избирательных участков (выборов 2014), где Народный фронт и блок Порошенко вместе получили число голосов более высокое, чем среднее по совокупности.

Марк Твен как-то сказал фразу, ставшую известной, о том, что есть три типа лжи: «Ложь, наглая ложь и статистика». По-видимому, он не был осведомлен о выборах в Украине, где результаты выборов могут лгать гораздо хуже, чем статистика. Статистические инструменты позволяют предположить, что масштаб фальсификации выборов в 2014 был значительно меньше, чем в 2012. В той степени, в которой Вы доверяете статистике, Вы можете воспринимать полученные нами результаты, как знак одобрения наукой результатов выборов 2014 г.

Послесловие. В Украине смешанная избирательная система — 53,2% мест распределяются по партийным спискам и 46,8% — по 198 избирательных округах. Наш анализ был проведен только для партийных списков. Часть обсуждений в Украине сосредоточены на том, следует ли Украине перейти на 100% голосование по партийным спискам, якобы, чтобы избежать нарушений в отдельных округах. Следовательно, было бы полезно дополнить исследование анализом остальных 198 избирательных округов. Кроме того, было бы интересно рассмотреть контрафактный состав нового украинского парламента, если бы по всей Украине явка была бы до той же степени затронута кризисом безопасности, как и на Востоке.

 Данные

2014: 99,52% избирательных участков покрыты, станции расположены за рубежом, не включенные
2012: 99,59% избирательных участков покрыты, станции расположены за рубежом, не включенные

Данные за 2014 год:

Доступ: 30.10.2014

Данные за 2012 год:

Доступ: 03.11.2012, в настоящее время не доступны по техническим причинам

Файлы, используемые для анализа доступны здесь

Это пересмотренный и расширенный вариант статьи, которая вышла в the Monkey Cage Blog at the Washington Post


Внимание

Авторы не работают, не консультируют, не владеют акциями и не получают финансирования от компании или организации, которая бы имела пользу от этой статьи, а также никоим образом с ними не связаны