Кирилл Захаров: Статистический Подход — Это Лишь 1 из 16 Методов Оценки Избирательного Процесса

Статья Юрия Городниченко и Тимофея Милованова описывает контекст промежуточных выборов народного депутата, прошедших 26 июля 2015 года в одномандатном избирательном округе №205.

Основной целью своего исследования авторы декларируют оценку честности избирательного процесса при помощи статистических методов. В качестве таковых были применены:

оценка связи явки избирателей и количества голосов, отданных за кандидата (при помощи регрессионного анализа);
оценка “вбросов” на участках (при помощи визуального анализа сигмоидной функции, отображающей зависимость кумулятивного количества голосов избирателей от явки);
оценка соответствия распределения первых цифр количества голосов на избирательны участках закону Бенфорда.

В статье есть упоминание, что сам избирательный процесс проходил с многочисленными нарушениями (открыты 37 уголовных дел), авторы указывают, что не будут оценивать честность кампании до дня выборов, а проанализируют только результаты голосования и возможные манипуляции с голосами.

Более корректным, на мой взгляд, было бы указание, что

(1) единственными данными, которые используются в анализе были результаты голосования, опубликованные на сайте Центральной избирательной комиссии и

(2) что предметом анализа являлись только статистические нерегулярности в указанных данных.

Рецензия является ответом на статью Довыборы в Верховную Раду в Чернигове в 2015 году: Статистика не Подтверждает Фальсификации, написанную Юрием Городниченко (Калифорнийский университет, Беркли) и Тимофеем Миловановым (Питтсбургский университет), сооснователями VoxUkraine

Игорь Буйный («Демократический альянс») не согласился с выводами материала и написал статью Довыборы в Верховную Раду в Чернигове в 2015 году: Похоже, Что Результаты Были Сфальсифицированы.

Своим взглядом на подсчет голосов поделился и Кирилл Захаров в материале Результаты Выборов По Одномандатному Избирательному Округу №205, он считает, что победу Березенко принесли структурированные сети избирателей.

В рецензиях к статье (здесь и здесь) Кирилл Захаров и Евгений Василенко утверждают, что подобные исследования помогут более точно выявить наличие злоупотреблений во время избирательного процесса и нарушений при подсчете голосов.

Избирательные фальсификации включают в себя достаточно широкий спектр различных методов. К ним относят не только незаконные действия, которые может осуществить избирательная комиссия, но также подкуп избирателей, угрозы или давление на избирателей и т. д. [1; 7]. Кроме незаконных методов есть целый спектр “серых” методов, которые формально не являются нарушениям, но предназначены для влияния на результат выборов. Одним из таких методов, например, является регистрация “двойников”. Так кроме Геннадия Олеговича Корбана были зарегистрированы кандидаты Карбан Геннадий Валерьевич и Корпан Галина Викторовна. Здесь же интересно отметить тот факт, что Центральная избирательная комиссия отказала в регистрации двум кандидатам, которые потенциально могли получить голоса про-президентского кандидата, — Березенко Игоря Анатольевича и Березенко Сергея Леонидовича [3; 4]. Соответственно, мы можем наблюдать попытку повлиять на результат выборов как со стороны кандидатов, так и со стороны официальных органов, занимающихся организацией выборов.

Ввиду вышеуказанных фактов, кажется нецелесообразным выделять в качестве анализа только день голосования без учета того, что происходило на протяжении всей избирательной кампании. Более того, данные протоколов о результатах выборов сами по себе также не отображают всю картину. Так в день голосования по ряду участков кандидатами были организованы концерты и представители кандидатов предлагали избирателям бойкотировать выборы и просто идти отдыхать на указанных мероприятиях. Поэтому применение статистического подхода в отрыве от контекста избирательной кампании будет иметь очень ограниченное применение. Так, например, избирательная комиссия США предлагает его лишь как один из 16 методов оценки избирательного процесса [6].

В качестве первого статистического теста авторы проводят оценку связи количества избирателей, пришедших на участки, и количества голосов, отданных за кандидата. Указано, что характер некоторых связей меняется при исключении ряда участков и следовало бы указать, какая граница количества избирателей была выбрана для фильтрации данных.

Данным тестом авторы планировали произвести оценку незаконных вбросов бюллетеней в избирательные урны. Следует указать, что из практических соображений на очень малых участках редко используется данная технология. С одной стороны, явка избирателей на таких участках сильно разнится, с другой стороны, превышение количества бюллетеней в урнах более чем на 5% превышающее количество избирателей, которые получили бюллетени, приводит к признанию выборов недействительными [2]. Поэтому исключение таких участков представляется достаточно обоснованным.

Тем не менее, дальнейшая интерпретация данных вызывает некоторые вопросы. Наличие связи само по себе действительно не может быть свидетельством фальсификаций. Но здесь не следует проводить аналогию с исследованиями более масштабных выборов, которые проходили ранее. Когда речь идет о выборах даже в рамках одной области, то есть смысл говорить о различном отношении к выборам избирателей различных регионах. Чаще всего, в каждой территориально-административной единице среднего уровня (реже первичного уровня) у политических партий имеются организации, в которых могут значительно отличаться методы администрирования избирательной кампании и средства мобилизации избирателей. В данном же случае речь идет лишь о части города и предполагать наличие каких-либо серьезных отличий от одного избирательного участка к другому можно лишь имея дополнительную информацию и обоснования.

Дальнейшее сравнение результатов Сергея Березенко с результатами Партии регионов в Донецкой области кажется неправомерным. Как ввиду различных масштабов соответствующих выборов (и ввиду этого некоторых отличий, например, в уровнях значимости статистических тестов), так и ввиду различных методов, применявшихся в рамках кампании. В Донецкой области Партия регионов по факту имела значительную поддержку и там решалась задача максимальной мобилизации избирателя с целью получения большего количества голосов в масштабах Украины (причем в достаточно большой мере был задействован административный ресурс — пики явки и голосов за Партию регионов приходятся на участки рядом с крупными промышленными предприятиями). В Чернигове вышла значительно меньшая явка ввиду того, что выборы являлись промежуточными и не имеют решающего значения для изменений в стране, кроме того, мотивация избирателей была значительно снижена деятельностью ключевых кандидатов в депутаты.

Авторы также указывают, что распределение явки близко к нормальному. Здесь можно согласиться в том, что на столь малой выборке статистические тесты обладают малой мощностью и потому имеют высокую вероятность получения статистической ошибки второго рода. Иными словами, можно ошибочно не отвергнуть нулевую гипотезу о том, что данные подчиняются закону нормального распределения, когда она ложна. Визуальный анализ показывает небольшую левостороннюю асимметрию, что указывает на форсирование явки. Опять же для больших выборок, как в случае с Донецкой областью, результат часто будет значим даже при небольших отклонениях распределения от нормального закона.

Второй аргумент, приведенный авторами указывал на то, что угол наклона линии регрессии по Донецкой области значительно больше, чем в случае с голосами Сергея Березенко. Здесь можно продолжить практику авторов и указать на контр-пример — результаты Ирины Фарион по 116 округу на выборах 2012 года. С результатом в 68% кандидату вряд ли был какой-либо смысл устраивать фальсификации, тем не менее регрессионный коэффициент явки на процент голосов за кандидата составляет 0.84729.

Следовательно делать на основании данного теста однозначный вывод о том, что со стороны кандидатов не было фальсификаций, следует с большой осторожностью.

Второй тест представляет собой визуальный анализ функции зависимости кумулятивного количества голосов за кандидатов от явки. Этот метод предлагался в работе [8]. Его применение рекомендовалось для определения т.н. инкрементных фальсификаций, когда фактически отнимаются голоса у одного кандидата в пользу другого кандидата, о чем, пожалуй, следует указать в статье. Кроме этого “плато” в графике для Сергея Березенко сохраняется в случае исключения из анализа избирательных участков с явкой более 60%. В противном случае, можно все же наблюдать небольшое отклонение.

Последний тест, который был проведен авторами, касается применения закона Бенфорда к распределению первых цифр в количествах голосов кандидатов по избирательным участкам. Данный метод действительно применяется в ряде работ. Более того, имеется также его развитие, когда анализируется не только первая цифра, а также и вторая [5; 9]. В развитии дискуссии вокруг данного метода на данный момент имеется мнение, что он позволяет по крайней мере указать на определенные нерегулярности в данных, которые следует рассмотреть более детально, но не следует применять как самодостаточный метод.

Авторы статьи указывают, что закономерность может не соблюдаться ввиду малой выборки. Если подходить к вопросу статистически, то следовало бы применить критерий хи-квадрат Пирсона для оценки различий между имеющимся эмпирическим распределением и законом Бенфорда. Авторы же приводят графики с доверительными интервалами и оперируя фразами “данные в общем близки”, “полученные результаты могут быть случайностями”, в целом, уходят от содержательного вывода по данным тестам. При визуальном анализе, на примере графика голосов Сергея Березенко, можно увидеть как 5 из 9 точек закона Бенфорда не попадают в доверительный интервал для пропорций первых цифр в голосах кандидата. Следовательно формулировка об общей близости требует, как минимум, уточнения. Нужно также указать, что сама практика использования доверительных интервалов в данной ситуации является сомнительной. В данном случае мы не пытаемся оценить некий параметр генеральной совокупности, а уже работаем с совокупностью избирательных участков и результатами на них. Более корректным видится подход с использованием генерации случайных распределений явок и голосов на участке с последующей оценкой реалистичности полученного эмпирического результата.

Окончательно можно заключить, что авторы применяют популярные и известные статистические методы, чтобы оценить честность избирательного процесса. Тем не менее, полученные результаты, скорее, оставляют пространство для размышлений, нежели позволяют однозначно заключить, что выборы прошли честно (даже если вывод касается только фальсификаций в день голосования).

Литература

[1] Кримінальний кодекс України // Відомості Верховної Ради України (ВВР), 2001, № 25-26, ст.131

[2] Про вибори народних депутатів України // Відомості Верховної Ради України (ВВР), 2012, № 10-11, ст.73

[3] Центральна виборча комісія. Про відмову в реєстрації кандидата в народні депутати України Березенка І.А. в одномандатному виборчому окрузі № 205 на проміжних виборах народного депутата України 26 липня 2015 року. ПОСТАНОВА від 26 червня 2015 року № 100.

[4] Центральна виборча комісія. Про відмову в реєстрації кандидата в народні депутати України Березенка С.Л. в одномандатному виборчому окрузі № 205 на проміжних виборах народного депутата України 26 липня 2015 року. ПОСТАНОВА від 24 червня 2015 року № 95.

[5] Deckert, J., Myagkov, M., & Ordeshook, P. C. (2010). The irrelevance of Benford’s law for detecting fraud in elections. Caltech/MIT Voting Technology ProjectWorking Paper, (9).

[6] Election Assistance Commission (EAC). Election crimes: An initial review and recommendations for future study. Final version. Released Dec 2006.

[7] Justin Levitt, The Truth About Voter Fraud (New York, NY: Brennan Center for Justice, New York University School of Law, November 2007), p. 18.

[8] Klimek, P., Yegorov, Y., Hanel, R., & Thurner, S. (2012). Statistical detection of systematic election irregularities. Proceedings of the National Academy of Sciences, 109(41), 16469-16473.

[9] Mebane Jr, W. R. (2006, July). Election forensics: Vote counts and Benford’s law. In Summer Meeting of the Political Methodology Society, UC-Davis, July (pp. 20-22).

Авторы

Кирилл Захаров, директор аналитического отдела Promedia Consulting

Предостережение

The author doesn`t work for, consult to, own shares in or receive funding from any company or organization that would benefit from this article, and have no relevant affiliations

Кирилл Захаров: Статистический Подход — Это Лишь 1 из 16 Методов Оценки Избирательного Процесса

Литература

Предостережение

Читайте по этой теме:

КПД 11 сессии: шаг назад в продуктивности

Что читать дальше

КПД 11 сессии: шаг назад в продуктивности