a_shen ([personal profile] a_shen) wrote2009-10-12 03:39 pm

выборы как социологический опрос

интересные данные и анализ опубликованы в http://uborshizzza.livejournal.com/674242.html




на этой картинке показаны данные голосования в разных местах. Для каждого места ставится несколько точек: по горизонтали откладывается официальная явка (общее число проголосовавших по мнению избиркома), а по вертикали -- доля проголосовавших за ту или иную партию (по тем же данным). [Upd: доля берётся от списочного количества, а не от проголосовавших - прошу прощения за неясность.] Таким образом, каждое место соответствует шестёрке точек (всех цветов), и сумма ординат этих точек равна их общей абсциссе.

Если предпочтения избирателей были независимы с явкой, то должны получиться четыре прямые, выходящие из начала координат под разными углами (наклон -- доля голосующих за эту партию). Видно, что эта гипотеза плохо согласуется с графиком.

Наблюдаемую картину можно объяснить смешиванием реальных голосов (которые примерно одинаковы в разных местах с точки зрения распределения по партиям) с добавленными (тем или иным способом) голосами за ЕР. Это предположение объясняет наклон голубой прямой (для ЕР -- рост явки на x соответствует увеличению доли голосов за ЕР на ту же величину x) и то, что для остальных партий результаты почти не зависят от явки. (Некоторая небольшая зависимость видна на рисунке, что можно ожидать, если какой-то разброс по явке всё-таки был.) Приняв такое предположение, автор записи http://uborshizzza.livejournal.com/674242.html оценивает первоначальные результаты (до предполагаемого добавления) - они соответствуют точкам с минимальной явкой, и получается

"Эта картинка укладывается в следующую гипотезу:
- реальная явка на выборы была около 22%
- из проголосовавших 40% отдали голоса за Единую Россию,
30% - за КПРФ и
оставшиеся 30% получили остальные партии"

Там же - для порядка, надо полагать - сказано о возможности иных статистических гипотез, но ни одной конкретной не упоминается. (Если кто-нибудь увидит осмысленное обсуждение других вариантов, сообщите - я добавлю update)

Интересно, решатся ли газеты типа "Коммерсанта" или "Ведомостей" опубликовать этот график хотя бы в разделе opinions - боюсь, что нет...

А ходил ли кто-нибудь (из читающих это) голосовать, кстати?

Update: http://community.livejournal.com/yabloko_party/180445.html приводит скан протокола по избирательному участку 1702 (копия, выданная наблюдателям) и данные с сайта избиркома. Там добавлено 550 голосов за ЕР (426->976), голоса за остальные партии без изменений. Явка соответственно выросла с 19% до 41% (что неплохо согласуется с картинкой)

в комментариях знатоки указывают на книгу http://www.amazon.co.uk/Forensics-Election-Fraud-Russia-Ukraine/dp/052176470X/ref=sr_1_33?ie=UTF8&s=books&qid=1255359575&sr=8-33 (где анализируются прошлые выборы)
Из рецензии на амазоне: "The book is important, not only for its substantive findings about Russia and Ukraine, but, perhaps even more, for the ingenious methodology its authors have devised for uncovering large-scale vote fraud. One of their major findings is that in recent years in Russia, the practice of vote fraud has spread from a relatively small number of ethnic republics, which are dominated by authoritarian leaders, to a much larger number of regions. So by the time of the 2004 presidential election and the 2007 Duma election, fraud was widespread. They also argue that the 2008 presidential election was so heavily manipulated that it is not worth applying their methods to it. Myagkov, Ordeshook and Shakin also analyze fraud in the famous 2004 Ukrainian presidential election, where massive falsifications provoked the ‘Orange Revolution.’ They show the very different patterns of voting from the (corrupted) run-off election in November 2004 to the (largely free and fair) new run-off in December, which followed the massive popular protest over election falsification"

в сети есть работа http://vote.caltech.edu/drupal/files/working_paper/vtp_wp63.pdf (при участии тех же авторов), где масштабные фальсификации относятся к периоду с 2004 года (а в 1996, как ни странно, они были скорее единичными)

Update: я нарисовал картинку для упомянутого в комментариях района "Щукино" и голосования за отдельных людей (там баллотировалась Хованская) - её результат отмечен синим цветом, результат "победителя" отмечен красным цветом. Видно, что общий характер картинки тот же самый. (Для каждого избирательного участка, кроме особых, где пришло больше половины списка - это, видимо, что-то типа больниц и пр. - по горизонтали отложена явка, по вертикали - проценты за кандидатов от списочного состава.)




а вот более конкретное описание процесса на отдельных участках: http://yakovlev-igor.livejournal.com/456910.html
(забавно, что многие изменения в цифрах кратны 10 - видимо, для простоты сложения:-)

http://podmoskovnik.livejournal.com/56185.html - более подробная картинка по голосованию в мосгордуму сейчас и в госдуму 2007 - те же прямые с дополнительными особенностями

Re: вероятно, Вы имеете в виду

(Anonymous) 2009-10-20 05:34 am (UTC)(link)
Я имел в виду то, что написал. Почитав комментарии к уборщице и много другого. Вот, например, уважаемый математический человек из Спб.
http://matholimp.livejournal.com/170608.html
"Пояснение для далеких от математики: процент голосов за Единую Россию оказался в жесткой линейной зависимости от (неправдоподобно завышенной) явки, тогда как у всех остальных партий процент голосов от явки вообще не зависит (как и должно быть)."


Почему функции должны быть линейны? Всего-то сумма производных равна единице да еще начальные условия, дающие сумма ординат равна абсциссе в какой-то точке.
Но это так, к слову. В некоторой разумной модели, как мне кажется, должны быть линейные неоднородные функции. Неоднородные потому что есть упрямые сторонники своих партий, обязательно приходящие на выборы.

Не вижу, чем моя гипотеза так уж страшна. Люди не поддерживающие власть понимают, что все равно победят "эти", и не идут на выборы, кроме протестующих. Считать, что протестующих постоянный процент, и что этот процент жестко, т.е. независимо от места, поделен на партии - разве это глупо?

Конечно, гипотеза о вбросе тоже укладывается в этот график. Но удивление "удивительной упертостью протестующих по части выбора партии и явки и остальных по части выбора партии" мне непонятно. Правильно я понял, что этого не может быть, согласно Вашей точке зрения? И, следовательно, в каждом !!! участке аккуратно рисовали=фальсифицировали определенный и постоянный процент за коммунистов, определенный за яблоко итд? Так надо понимать? И нигде не ошиблись, не перестарались например? Не верю.

Остальные аргументы о прошлых годах совсем внематематические...

да, в этом тексте

[identity profile] a-shen.livejournal.com 2009-10-20 09:53 am (UTC)(link)
путаница - смешиваются графики для доли от голосовавших (которые могли бы быть константами в принципе) и для доли от списочного состава (которые могли бы быть линейными функциями). Вторые, естественно, не обязаны быть линейными - без всяких предположений можно лишь сказать, что сумма ординат равна абсциссе во всех точках (для каждого участка) - примерно как Вы и говорите (в терминах производных)

Про Вашу гипотезу: поскольку количество голосующих в каждом участке довольно велико, просто флуктуациями такое различие в явке объяснить трудно. Возможные объяснения - либо различия в составе жителей и их взглядах (типа бедных и богатых районов), либо различия в степени активности избирательных комиссий (был ли на участке буфет, обходили ли квартиры). Первое объяснение не объясняет сравнительного постоянства числа голосовавших за неЕР-партии, социальные различия в районах могли бы сказаться и на других партиях (к тому же в близких участках результаты оказывались сильно различными). Второе объяснение предполагает, что усилия по привлечению избирателей или удобное расположение участка никак не влияют на голосующих за неЕР. Оба варианта теоретически возможны, но довольно удивительны.

Что касается гипотезы о вбросе (см. видеоролик о бюллетенях в кладовке) или фальсификации (см. пример различия между протоколов и данными), то никто не говорит, что это было во всех участках (тогда бы и разброса не было). Предполагается, что дополнительные бюллетени и изменения в протоколах были в пользу ЕР - в тех случаях, когда были (и в тех размерах, которые были) - и это вполне объясняет как разброс явки и процента ЕР, так и постоянство других показателей - ведь добавить бюллетени технически проще, чем подменить или неправильно пересчитать. Тем более что - судя по процентным пикам - задания могли быть именно по проценту ЕР, и с этой точки зрения достаточно добавления. Речи о том, что "нигде не ошиблись и не перестарались", нет - случай с участком Митрохина как раз можно считать таким "перестаранием".

Разумеется, в такого рода статистических вопросах аргументы носят не математический характер, речи о доказательстве в математическом смысле слова нет. Скажем, если камера супермаркета зафиксировала человека, похожего на X, выносящего что-то под полой, подсчет обнаружил пропажу товара Y на складе, а дома у X большие запасы товара Y, то ни один из этих фактов ничего не доказывает. Даже совпадение недостачи с размером запаса можно объяснить различными способами.