a_shen ([personal profile] a_shen) wrote2009-10-12 03:39 pm

выборы как социологический опрос

интересные данные и анализ опубликованы в http://uborshizzza.livejournal.com/674242.html




на этой картинке показаны данные голосования в разных местах. Для каждого места ставится несколько точек: по горизонтали откладывается официальная явка (общее число проголосовавших по мнению избиркома), а по вертикали -- доля проголосовавших за ту или иную партию (по тем же данным). [Upd: доля берётся от списочного количества, а не от проголосовавших - прошу прощения за неясность.] Таким образом, каждое место соответствует шестёрке точек (всех цветов), и сумма ординат этих точек равна их общей абсциссе.

Если предпочтения избирателей были независимы с явкой, то должны получиться четыре прямые, выходящие из начала координат под разными углами (наклон -- доля голосующих за эту партию). Видно, что эта гипотеза плохо согласуется с графиком.

Наблюдаемую картину можно объяснить смешиванием реальных голосов (которые примерно одинаковы в разных местах с точки зрения распределения по партиям) с добавленными (тем или иным способом) голосами за ЕР. Это предположение объясняет наклон голубой прямой (для ЕР -- рост явки на x соответствует увеличению доли голосов за ЕР на ту же величину x) и то, что для остальных партий результаты почти не зависят от явки. (Некоторая небольшая зависимость видна на рисунке, что можно ожидать, если какой-то разброс по явке всё-таки был.) Приняв такое предположение, автор записи http://uborshizzza.livejournal.com/674242.html оценивает первоначальные результаты (до предполагаемого добавления) - они соответствуют точкам с минимальной явкой, и получается

"Эта картинка укладывается в следующую гипотезу:
- реальная явка на выборы была около 22%
- из проголосовавших 40% отдали голоса за Единую Россию,
30% - за КПРФ и
оставшиеся 30% получили остальные партии"

Там же - для порядка, надо полагать - сказано о возможности иных статистических гипотез, но ни одной конкретной не упоминается. (Если кто-нибудь увидит осмысленное обсуждение других вариантов, сообщите - я добавлю update)

Интересно, решатся ли газеты типа "Коммерсанта" или "Ведомостей" опубликовать этот график хотя бы в разделе opinions - боюсь, что нет...

А ходил ли кто-нибудь (из читающих это) голосовать, кстати?

Update: http://community.livejournal.com/yabloko_party/180445.html приводит скан протокола по избирательному участку 1702 (копия, выданная наблюдателям) и данные с сайта избиркома. Там добавлено 550 голосов за ЕР (426->976), голоса за остальные партии без изменений. Явка соответственно выросла с 19% до 41% (что неплохо согласуется с картинкой)

в комментариях знатоки указывают на книгу http://www.amazon.co.uk/Forensics-Election-Fraud-Russia-Ukraine/dp/052176470X/ref=sr_1_33?ie=UTF8&s=books&qid=1255359575&sr=8-33 (где анализируются прошлые выборы)
Из рецензии на амазоне: "The book is important, not only for its substantive findings about Russia and Ukraine, but, perhaps even more, for the ingenious methodology its authors have devised for uncovering large-scale vote fraud. One of their major findings is that in recent years in Russia, the practice of vote fraud has spread from a relatively small number of ethnic republics, which are dominated by authoritarian leaders, to a much larger number of regions. So by the time of the 2004 presidential election and the 2007 Duma election, fraud was widespread. They also argue that the 2008 presidential election was so heavily manipulated that it is not worth applying their methods to it. Myagkov, Ordeshook and Shakin also analyze fraud in the famous 2004 Ukrainian presidential election, where massive falsifications provoked the ‘Orange Revolution.’ They show the very different patterns of voting from the (corrupted) run-off election in November 2004 to the (largely free and fair) new run-off in December, which followed the massive popular protest over election falsification"

в сети есть работа http://vote.caltech.edu/drupal/files/working_paper/vtp_wp63.pdf (при участии тех же авторов), где масштабные фальсификации относятся к периоду с 2004 года (а в 1996, как ни странно, они были скорее единичными)

Update: я нарисовал картинку для упомянутого в комментариях района "Щукино" и голосования за отдельных людей (там баллотировалась Хованская) - её результат отмечен синим цветом, результат "победителя" отмечен красным цветом. Видно, что общий характер картинки тот же самый. (Для каждого избирательного участка, кроме особых, где пришло больше половины списка - это, видимо, что-то типа больниц и пр. - по горизонтали отложена явка, по вертикали - проценты за кандидатов от списочного состава.)




а вот более конкретное описание процесса на отдельных участках: http://yakovlev-igor.livejournal.com/456910.html
(забавно, что многие изменения в цифрах кратны 10 - видимо, для простоты сложения:-)

http://podmoskovnik.livejournal.com/56185.html - более подробная картинка по голосованию в мосгордуму сейчас и в госдуму 2007 - те же прямые с дополнительными особенностями

разумеется, никакие статистические

[identity profile] a-shen.livejournal.com 2009-10-16 02:51 pm (UTC)(link)
данные не могут рассматриваться как математическое доказательство, и при сравнении различных гипотез полезно учитывать контекст - данные по выборам в другие годы, в других странах, другие наблюдения. Скажем, гипотеза о фальсификациях хорошо объясняет также и пики на кратных 5 значениях (в этом году - для процента ЕР, в прошлые годы - для явки). Имеющиеся в интернете рассказы наблюдателей о фальсификациях на конкретных участках (а также просто о явке на них) также хорошо с ней согласуются. Различие в активности местных комиссий по обзвону электората и беготне по квартирам, которое могло бы привести к такому разбросу явки, было бы скорее всего замечено жителями, и пр. Об анализе других лет и стран см. подробнее цитированную работу (там изучается вид кривой явки, среди прочего)

Re: разумеется, никакие статистические

[identity profile] jktue.livejournal.com 2009-10-16 03:54 pm (UTC)(link)
я привел всего лишь пример другой гипотезы, в пользу которой также "голосует" очень много слабых свидетельств (вроде интернет-откровений наблюдателей).

беготня, агитация за явку и обзвон членами комиссий вполне себе замечаемое мероприятия. самолично со сменой места жительства стал жертвой :) адресной рекламы местной черезчур активной комисии. просто такие свидетельства (а) не очень согласуются с гипотезой о фальсификации (б) не настолько скандальны, чтобы попасть в интернет-свалку.

вопрос о слабости

[identity profile] a-shen.livejournal.com 2009-10-16 03:59 pm (UTC)(link)
свидетельств в конечном счете всегда остается на усмотрение читателя. Мне упомянутые выше свидетельства (по ссылкам и по упомянутым там ссылкам) кажутся весьма убедительными. А как лично Вы оцениваете сравнительные шансы упомянутых двух гипотез?

кстати,

[identity profile] a-shen.livejournal.com 2009-10-16 04:01 pm (UTC)(link)
рассказы о конкретных фальсификациях и об участии в них тоже встречаются (помимо знаменитых пьяных откровений)

Re: вопрос о слабости

[identity profile] jktue.livejournal.com 2009-10-19 12:31 pm (UTC)(link)
Никак не оцениваю :). У меня мало информации. Соцопросы бы посмотреть предвыборные. Для начала.

По части первой гипотезы мне бросается в глаза то, что ее реализация это 142УК (фальсификация выборов). Соответственно, где тогда копии заявлений в Прокуратуру. Не верю одновременно в бесстрашие членов УИК, повсеместно нарушавших Закон, и жуткую пугливость наблюдателей, это нарушение созерцавшие.

Я думаю все действия, искажающие итоги выборов, делаются задолго до них. На этапе регистрации, распределения эфирного времени и т.д.

так все-таки

[identity profile] a-shen.livejournal.com 2009-10-19 04:53 pm (UTC)(link)
никак не оцениваете (как вначале) или считаете более вероятной вторую (как в конце)?!

Re: так все-таки

[identity profile] jktue.livejournal.com 2009-10-19 05:05 pm (UTC)(link)
Я привел доводы против первой, а не за вторую. может есть еще много других механизмов.

В паре повсеместный вброс vs его отсутствие я проголосую за второе.
В паре повсеместный вброс vs вторая гипотеза я не могу ничего сказать, так никак не могу квалифицировано оценить вторую модельку (кроме того, что она простая).

чего-то я не понимаю

[identity profile] a-shen.livejournal.com 2009-10-19 07:21 pm (UTC)(link)
есть предположение, что вид кривой (корреляции с явкой) в основном объясняется фальсификациями при голосовании и подсчете (то, что задолго до выборов - не учитывается) - и тем самым даже можно примерно оценить масштаб изменений в результатах

второй вариант, что таких фальсификаций не было или были они в незначительных размерах, а статистически странное поведение (отличное от прошлых лет, в частности) объясняется чем-то другим.

Правильно ли я понимаю, что второй вариант представляется лично Вам более правдоподобным?

тогда, наверно,

[identity profile] a-shen.livejournal.com 2009-10-20 09:29 am (UTC)(link)
Вам будет интересно попробовать сходить на следующие выборы в качестве наблюдателя (если они будут и если это будет возможно)

подробное обсуждение вынесено

[identity profile] a-shen.livejournal.com 2009-10-23 07:41 pm (UTC)(link)