снова о прикладной статистике
Dec. 17th, 2011 01:51 amобновил обзор статистических данных по выборам и их обсуждение, добавив материалы этих выборов
http://www.lif.univ-mrs.fr/~ashen/elections.pdf
UPDATE: добавил ссылки, в том числе на разнообразных критиков гипотезы фальсификаций (вроде бы новых не упомянутых аргументов там не обнаружилось)
http://www.lif.univ-mrs.fr/~ashen/elections.pdf
UPDATE: добавил ссылки, в том числе на разнообразных критиков гипотезы фальсификаций (вроде бы новых не упомянутых аргументов там не обнаружилось)
no subject
Date: 2011-12-16 10:34 pm (UTC)да,
Date: 2011-12-16 10:36 pm (UTC)Re: да,
Date: 2011-12-17 11:40 am (UTC)да,
Date: 2011-12-17 01:25 pm (UTC)no subject
Date: 2011-12-18 03:46 am (UTC)хотяЮ конечно, это должен был автор сделать, прежде чем выкладывать
no subject
Date: 2011-12-20 12:06 am (UTC)no subject
Date: 2011-12-16 11:02 pm (UTC)Александр Ханевич,
Date: 2011-12-17 01:35 am (UTC)Но...
А в милицию Вы обращались?
см. ЛС
Date: 2011-12-17 01:28 pm (UTC)Re: см. ЛС
Date: 2011-12-17 06:52 pm (UTC)no subject
Date: 2011-12-17 03:39 am (UTC)вот здесь есть графики ЕР по всем регионам России
no subject
Date: 2011-12-17 04:12 am (UTC)Снова об алгоритмической статистике
Date: 2011-12-17 07:29 am (UTC)no subject
Date: 2011-12-17 10:14 am (UTC)Кроме того, здесь есть замечание о выборах в Парламент Великобритании, где тоже имеется корреляция между результатами партий и явки.
Я считаю, что критика по ссылке весьма интересна, а вот научная ценность труда Арлазарова примерно равна коммерческой ценности его Cuneiform'а.
про пики
Date: 2011-12-17 01:28 pm (UTC)no subject
Date: 2011-12-18 01:26 am (UTC)Пессимистический конец статьи
Date: 2011-12-17 07:49 pm (UTC)Мне кажется, что вы говорите такие слова, так как не знаете достаточно точного метода оценки фальсификаций. Польза от получения очищенных от искажений результатов есть, и немаленькая. Помимо организации пересчёта на особо отличившихся участках с возбуждением полагающихся по закону дел о фальсификациях, что будет иметь профилактический эффект для соучастников в будущем, выявление групп, регионов, где больше фальсификаций позволяет наметить направление будущих действий по контролю за предстоящими выборами со стороны общественности.
Между тем, можно предложить достаточно точный способ определения добавленных бюллетеней, если задаться предполагаемым "правильным" распределением голосов в зависимости от явки. Например, гауссовым, а затем подобрать его параметры, основываясь на том, что такое распределение должно проходить через некоторые точки (начала кривой и точку перемены тенденции распределения за доминирующую партию) а также вполне определённую необходимую площадь данного "эталонного" распределения. По моим прикидкам, основанным на реализации такого подхода, число добавленных бюллетеней составляет примерно 6,3 млн. (5,8% от числа избирателей).
Это не окончательные цифры фальсификаций, поскольку этим методом нельзя посчитать количество переписанных в пользу ЕР бюллетеней от других партий. (Их тоже можно оценить, если постулировать линейную зависимость голосов за партию от истинной явки, но менее точно из-за принципиальной невозможности узнать форму распределения для вброса).
no subject
Date: 2011-12-17 08:47 pm (UTC)no subject
Date: 2011-12-18 07:24 am (UTC)1. На рисунке 24 для выделения территории используется цвет, которым на картах часто обозначают промзоны (и на рис.25 этот же цвет обозначает именно промзону). Это не очень удачно в контексте обсуждения, где речь идет о том, что люди в этих домах живут, скорее всего, похожие друг на друга.
2. Мне кажется, что если идти от метро Багратионовская по улице Барклая в сторону Филевского парка, то справа будет номенклатурный район, а слева - рабочий (сам я там не жил, но бывал в гостях несколько раз и с той и с другой стороны).
посмотрел
Date: 2011-12-18 07:43 am (UTC)в любом случае наличие двух кластеров выглядит довольно странно с точки зрения гипотезы о неравномерном распределении социальных групп
Re: посмотрел
Date: 2011-12-18 08:37 pm (UTC)no subject
Date: 2011-12-18 07:29 am (UTC)ну, вряд ли
Date: 2011-12-18 09:39 am (UTC)Re: ну, вряд ли
Date: 2011-12-18 12:50 pm (UTC)это обсуждается
Date: 2011-12-18 01:25 pm (UTC)no subject
Date: 2011-12-22 02:17 am (UTC)В частности, попытки объяснения результатов без привлечения гипотезы о фальсификации, которые Вы цитируете, звучат довольно неуверенно (после разделения странности всё равно остаются...) да ещё и заканчиваются фразой "Короче, ситуация тут так и остаётся неясной". Ситуация, конечно, остаётся неясной - с социоэкономическими причинами зависимости голосов от явки; но из Ваших слов создаётся впечатление, что ситуация остаётся неясной и с тем, были ли фальсификации. Действительно, с фальсификациями в отдельных районах удалённых штатов нет никакой ясности. А вот с тем, что английские консерваторы (у которых зависимость голоса/явка покруче чем у ЕР) и либдемы (у которых два горба в гистограмме явки) или ХДС/ХСС в состоянии сфальсифицировать выборы на десятки процентов по всей стране (а не по отдельным районам графств и земель) ясности гораздо больше. Так что умалчивая об этих простых примерах и разбирая вместо них сложные, Вы по-моему поступаете нехорошо, чем-то это напоминает претензии Путина к ситуации с соблюдением прав человека на Западе...
Что касается однородности избирательных участков в Москве, то карты голосований прошлых лет за Яблоко вроде как и показывают достаточно серьёзную неоднородность. Мне кажется, было бы более убедительным рассмотреть такой параметр как угол наклона градиента гладкой функции от двух переменных, аппроксимирующих результат ЕР (или Яблока, или явку) как функции от точки на карте. Грубо говоря, это среднее различие между достаточно близкими участками по голосам за ЕР. Понятно, что если напротив университета - военная часть, в этом месте параметр будет аномально большим, но площадь областей с такими резкими перепадами невелика, так что интеграл этого параметра по всей Москве должен быть хорошей мерой неоднородности фальсификаций. Если откалибровать по предыдущим выборам, можно судить и об уровне фальсификаций. Этот метод, кажется, существенно отличается от методов, обсуждаемых в Вашей статье тем, что он учитывает географию участков.
no subject
Date: 2011-12-22 04:03 am (UTC)насколько я понимаю, анализ территориальных зависимостей усложняется тем, что 1) на разных выборах нумерация участков может быть разной, и 2) данных о координатах участков в машинно-читаемой форме нет.
Re: ну, вряд ли
Date: 2011-12-19 12:40 pm (UTC)1. Каждый штат имеет свои собственные законы начиная от дорожных правил, гражданских законов и кончая криминальными(в отличии от объектов федерации России)
2. Каждый штат напрямую (без какого бы нибыло вмешательсва центра) избирает свою законодательную, исполнительную и судебную властьБ в отличии от России (приходят губернаторами люди очень экзотические).
3. Каждый штат имеет свою налоговую систему (!) и это пожалуй самое главное (такого в России вообще нет).
Очень странно с этой точки зрения, что кривые голосования, только в некоторых штатах отличаются.
no subject
Date: 2011-12-18 11:50 pm (UTC)no subject
Date: 2011-12-18 11:51 pm (UTC)Зачем придумывать мифическое проседание грунта?
Date: 2011-12-19 11:55 pm (UTC)Ведь из классики хорошо известно, что рулетка просто рассыхается, если стот близко к печке. (см. рассказы Джека Лондона про Смока Белью).
no subject
Date: 2011-12-20 04:42 am (UTC)Скажите, а у Вас нет текста на английском? И на какой email Вам писать? Один из авторов статьи в Эсквайере хотел пообщаться)
к сожалению, нет
Date: 2011-12-20 06:20 am (UTC)Re: к сожалению, нет
Date: 2011-12-20 07:33 am (UTC)no subject
Date: 2011-12-20 06:03 pm (UTC)Спасибо большое за данный обзор. С удовольствем прочитал.
no subject
Date: 2011-12-21 08:20 am (UTC)http://www.gazeta.ru/news/lenta/2011/12/19/n_2140062.shtml
Также есть данные по Москве от ФОМ (они потом исправили их на сайте)
https://lh6.googleusercontent.com/-t0PQizglKcw/Tt5MrLGjX8I/AAAAAAAAAVo/OS14IQO0OCs/s705/table.png
Там 27.5%
Видимо, вот и пределы реального результата ЕдРо по Москве.
Интересно было бы сравнить их с предсказательными возможностями различных моделей и определить наиболее рабочие.
no subject
Date: 2011-12-26 06:06 pm (UTC)no subject
Date: 2012-01-06 09:30 am (UTC)Дело в том, что по региональному закону "проходные" места в ЗакС определяются долей голосования за кандидата от партии на конкретном участке. Поэтому каждый кандидат заинтересован в увеличении своего результата. Ну а дальше - у кого какие возможности... Однако, поскольку любая фальсификация стоит денег - на "карусель", на оплату председателей, на занос в ТИКи - то питерские кандидаты, имеющие доступ к определённым технологиям, совершенно не были заинтересованы проплачивать думские фальсификации. Отсюда и разница, которая может достигать 1300 голосов на участке, где проголосовало либо 1179 человек (данные выборов в ГД), либо 1677 человек (данные выборов в ЗС) - УИК 1445 :)))
no subject
Date: 2012-01-06 10:52 am (UTC)no subject
Date: 2012-01-06 12:14 pm (UTC)А на другом конце шкалы собраны - очень интересно - участки по территории 47, где превышение голосов за ЕР на думских выборах скоррелировано с превышением количества бюллетеней... (ну, был вброс за ЕР в ГД, не знаю почему), и ряд участков по территориям 35, 43, 22, 7 и др... Чтобы понять, надо знать, что в СПб Едру не только дописывали, но и отнимали :) Например, знаменитая территория 43: (http://lovim-vorov.livejournal.com/tag/%D0%92%D0%BE%D0%BB%D1%87%D0%B5%D0%BA%20%D0%93.%D0%91.) По 22 отнимали у Риммера, чтобы провести нужного кандидата от КПРФ, по 35 и 7 шли "ненужные" кандидаты и пр.
Такая вот очень прикладная статистика ;)