грустное о В.Л.Арлазарове,
Mar. 30th, 2013 09:03 amкоторый один из "четырёх русских" в соответствующем алгоритме, участвовал в разработке шахматных программ и пр.
В своё время он опубликовал (вместе с Чуровым и Соловьёвым) опубликовал статью с критикой применения Шпилькиным статистических методов для анализа выборов, где были приведены статистические данные по "25 регионам". Ещё тогда ошибки в анализе и (главное) отсутствие списка регионов или принципов их отбора вызывали подозрения в недобросовестности авторов (см. ссылки, подробности и обсуждение в http://arxiv.org/abs/1204.0307). Сейчас один из авторов статьи (Соловьёв) предоставил М.Пшеничникову список регионов, так что стало возможным проверить эти подозрения - и, на мой взгляд они подтвердились, что называется beyond the reasonable doubt: http://oude-rus.livejournal.com/672723.html. Сочетание результатов сравнения с текстом статьи, на мой взгляд, не может быть объяснено ничем, кроме сознательного жульничества со стороны Арлазарова и К. А жаль - он всё-таки был один из не таких многочисленных заслуженно известных представителей советской computer science, а вот поди ж ты - таки "встал с колен"...
В своё время он опубликовал (вместе с Чуровым и Соловьёвым) опубликовал статью с критикой применения Шпилькиным статистических методов для анализа выборов, где были приведены статистические данные по "25 регионам". Ещё тогда ошибки в анализе и (главное) отсутствие списка регионов или принципов их отбора вызывали подозрения в недобросовестности авторов (см. ссылки, подробности и обсуждение в http://arxiv.org/abs/1204.0307). Сейчас один из авторов статьи (Соловьёв) предоставил М.Пшеничникову список регионов, так что стало возможным проверить эти подозрения - и, на мой взгляд они подтвердились, что называется beyond the reasonable doubt: http://oude-rus.livejournal.com/672723.html. Сочетание результатов сравнения с текстом статьи, на мой взгляд, не может быть объяснено ничем, кроме сознательного жульничества со стороны Арлазарова и К. А жаль - он всё-таки был один из не таких многочисленных заслуженно известных представителей советской computer science, а вот поди ж ты - таки "встал с колен"...
no subject
Date: 2013-03-30 06:08 am (UTC)no subject
Date: 2013-03-30 10:59 am (UTC)no subject
Date: 2013-03-30 11:19 am (UTC)А уж если злоупотреблять ей осознанно..
Самые крупные апельсины больше самых мелких арбузов, и можно отбором доказать, что апельсины в этом супермаркете - больше арбуза.
Если студент на экзамене заранее знает любимые вопросы экзаментора и видел как разложили билеты - он может создать впечатление что знает весь курс, хотя выучил только 5%
no subject
Date: 2013-03-30 06:35 pm (UTC)Думаю, что Вы с этими базовыми принципами статистического анализа согласны. Скажем, если в какой-то работе говорится об эффективности лекарства на какой-то выборке, то критиковать её, анализируя подвыборку, в которую попали в основном тяжёлые больные, некорректно, и с этим, по-моему, должны согласиться грамотные люди независимо от их политических взглядов...
no subject
Date: 2013-03-30 06:46 pm (UTC)1) я слышал о подгонке результатов голосования от знакомых наблюдателей (занятно, что на этих участках незначительно уменьшали голоса за Путина до правильных цифр), и не сомневаюсь в наличии искажений
2) интересен масштаб; если есть 25 регионов без искажений, это интересно - собственно, можно ли интерпретировать их результаты хотя бы таким образом.
no subject
Date: 2013-03-30 08:14 pm (UTC)Оценка масштаба фальсификаций статистическими методами неизбежно довольно грубая, и, собственно, попытки таких оценок разными методами и составляли содержание многих статистических работ (Шпилькин, Пшеничников, Кобак и другие). В частности, они сравнивали и результаты по разным регионам. Такие же данные есть, как я понимаю, и для выборов Медведева (о которых шла речь у Арлазарова и К), в принципе, все эти методы можно применять и к ним (и Пшеничников об этом пишет). Но чем тут может быть полезна статья А.?
no subject
Date: 2013-03-30 09:36 am (UTC)no subject
Date: 2013-03-30 08:56 pm (UTC)По-моему, данный ресурс предназначен, мягко говоря, для совсем другого.
no subject
Date: 2013-03-30 09:29 pm (UTC)no subject
Date: 2013-03-30 09:46 pm (UTC)no subject
Date: 2013-04-01 02:37 am (UTC)no subject
Date: 2013-03-31 09:55 am (UTC)no subject
Date: 2013-03-31 11:09 am (UTC)no subject
Date: 2013-03-31 02:15 pm (UTC)Так что, наверно, его попросил кто-то, кому он не мог отказать.
Ну или он решил заработать на персональный самолет :)
no subject
Date: 2013-04-01 05:27 am (UTC)тингах и в интернете. К сожалению, значительная часть обсуждений основана на
недоразумениях: многие сторонники гипотезы фальсификаций не понимают слож-
ностей статистического анализа и приводят доводы типа «раз распределение не по
Гауссу — значит жулики». С другой стороны, многие их оппоненты, справедливо
указывая на необоснованность таких доводов, ограничиваются этим и не знакомятся
с реальными аргументами в пользу гипотезы фальсификации.
А как, вообще, народ проверял "по Гауссу". В статистике, разумеется, ничего нельзя доказать. Во фриквентистской можно опровергнуть нуль гипотезу с таким-то p-value, построить интервал. Но все не это более, чем подстраховка на случай: если мы провели анализ эн-выборов, в ста тысячах случаев считаем, что случилось мошенничество, возможно что в пяти тысячах случаев наши выводы не верны. А у нас единственные выборы. Уж не знаю легче ли Байзианцам, но у них такой страшный prior, что одних выборов точно будет недостаточно его преломить :-)
no subject
Date: 2013-04-01 06:11 am (UTC)no subject
Date: 2013-04-01 06:20 am (UTC)no subject
Date: 2013-04-01 06:56 pm (UTC)2) Разумеется, гистограмма не совпадает (ни в одной стране) в точности с нормальным распределением, речь идёт о сравнении их форм в разных странах и в разное время, а также анализе по частям. См. подробно в том самом обзоре, где много читать, и по ссылкам, где читать ещё больше.
no subject
Date: 2013-04-01 07:15 am (UTC)Да, вот это место, именно это. Можно его поточнее? Мне почему-то кажется, что нельзя.
2. Можешь ли ты привести пример корректного и точного вывода, который хоть как-то может быть применён вне этой деятельности? То есть, оно конечно: можно брать данные и применять к ним методы. Вопрос: зачем это делать? Мне почему-то кажется, что эту процедура осмысленна только в связке с демагогией.
no subject
Date: 2013-04-02 11:50 am (UTC)2. Смысл этих статистических работ, IMHO - во-первых, это сравнение на довольно большом материале, в котором есть и нестатистические данные (протоколы наблюдателей, видео и пр.), разных методов визуализации данных; во-вторых, по-моему, вообще полезно в исторических и не только целях осознавать и фиксировать происходящее.