edgeways.ru
|
|
Еще раз о выборной математике. Пользователь: Дежавю (IP-адрес скрыт) Дата: 21, December, 2011 17:56 [perevodika.ru]
Упражнения с калькуляторами. Третья часть Гауссиниады Дополнение к предыдущим частям (часть первая и вторая): Результаты голосования по выборам в Госдуму отменены из-за нарушений на 21 избирательном участке Москва. 20 декабря. INTERFAX.RU - В день выборов с избирательных участков были удалены 600 наблюдателей, в ЦИК поступило более 1600 обращений по поводу нарушений, сообщил зампред ЦИК России Леонид Ивлев. "Всего 4 декабря, в день голосования, с избирательных участков удалено ровно 600 наблюдателей, в том числе, от газеты "Голос" - три человека, в Санкт-Петербурге, Челябинской области и Адыгее", - сказал Л.Ивлев на слушании в Общественной палате РФ во вторник. Л.Ивлев сообщил, что 124 обращения не рассмотрено, так как 41 из них направлено в Генпрокуратуру, 63 - в МВД и 20 - в СК. Л.Ивлев сообщил, что отменены результаты голосования на 21 избирательном участке по стране, где проголосовали 39 тыс. избирателей. "Абсолютное большинство жалоб не подтверждается. Мы просмотрели 26 роликов в Youtube, из них только в одном вскрыто нарушение, но и там попытка вброса была замечена и предотвращена. Более чем в половине роликов был внутрикадровый и межкадровый монтаж", - добавил Ивлев. Смотрите оригинал материала на [www.interfax.ru] Пять копеек про фальсификации на выборах Читая блоги и слушая выступления "политологов", я заметил что все они в качестве одного из "очевидных" свидетельств фальсификаций прошедших выборов называют огромную разницу в результатах отдельной партии на соседних участках. Обычно это выглядит так "Ну очевидно, что участки, расположенные территориально рядом, не могут давать столь разные результаты: в участке х за партию 10%, а в участке x+1 за эту же партию 50%, налицо фальсификация и...." Ну не могут рядом жить столь разные люди. Причины такой разницы вроде бы обывателю очевидны: 1. В чистом виде фальсификация (вброс, карусель, неправильный подсчет и т.д.) 2. Административный ресурс: всех напугали/заставили/привезли или подобное. А сколько из этого обоснования выросло математических моделей и упоминаний авторитетных ученых (Гаусс вертится волчком). Как правило, все в итоге сводится к обвинению Единой России. Из интереса я сделал простую вещь: выбрал наугад субъект федерации (им оказался Санкт-Петербург), затем территорию (попалась под номером 18) и посмотрел на результаты выборов (в данном случае в ЗакСобрание СПБ но это не так важно). Вот эта страничка…….. Бегло просматривая результаты УИКов, глаза лезут на лоб: УИК 622 сделал УИК 623 по результатам за ЛДПР в 11 раз (16,45% против 1,5%) УИК 629 обогнал УИК 630 по результатам эсеров в 4,5 раза (45,78% против 10,56%) На УИК 628 коммунисты жестоко посмеялись над собратьями из УИК 629 (17,89% 0,81% соответственно)…… Таким, образом, родилось два очевидных в свою очередь вывода: 1) либо ВСЕ ПАРТИИ НАДУВАЮТ ДРУГ ДРУГА ГДЕ МОГУТ 2) либо РАЗНИЦА В РЕЗУЛЬТАТАХ В РЯДОМ СТОЯЩИХ УЧАСТКАХ ИМЕЕТ ДРУГУЮ ПРИРОДУ Неинформированные массы мешают меньшинству переубедить большинство Коллектив может последовать за меньшинством вопреки мнению большинства, если меньшинство уверено в своей правоте и проявит достаточно упрямства. Компьютерное моделирование и эксперименты на рыбах показали, что способность информированного меньшинства повести за собой группу снижается, если в группе много неинформированных (наивных) индивидов, не имеющих собственного мнения и ориентирующихся только на поведение соседей. Таким образом, неинформированные массы делают коллективные решения более «демократичными». Впрочем, если доля неинформированных особей слишком велика, демократия превращается в хаос — коллективные решения начинают приниматься случайным образом…… Ну а теперь приступим собссно к математике. Выдача калькуляторов и учебников платная. Из комментов в жежешечке: Невежды - это те, кто выучил фамилию Гаусса и на этом остановился. Забыв даже прочитать условия применимости нормального распределения. Автор Папа Карло: Объясните математикой голосование в деревне, где самый авторитетный человек за ЕР и все голосуют так же. Исходнег, простихосподи: Статистика исследовала выборы. Статистический анализ выборов в Госдуму 2011 года показывает возможные фальсификации Все дальнейшие буквы посвящены потрошению этого продукта математической мысли Железный аргумент для ЦИКа: статистика не докажет фальсификации В последнее время растущий интерес к диагностике электоральных фальсификаций в России подкрепляется большим количеством расчетов и графиков, с помощью которых делается попытка не только научно обосновать наличие электоральных фальсификаций в России, но и измерить их масштабы……… Итак, насколько попытки доказать факт наличия фальсификаций соответствуют современному научному знанию в данной области? Ответ на этот вопрос очень непростой. Я постараюсь на него ответить, изложив вкратце логику научного метода, а также отдельно затронув три любопытных наблюдения, всколыхнувших российское интернет-сообщество: 1) отсутствие на российских выборах «нормального» гауссовского распределения явки и голосования; 2) визуальное наличие пиков-спайков-зубцов в распределениях явки и голосования; и 3) существование положительной взаимосвязи между явкой и голосованием за «Единую Россию». Все эти три наблюдения, три своеобразных кита, на которых строится отечественный фальсификационный анализ, по-своему интересны и по-своему спорны. Использование этих трех методов отечественными «сталкерами», исследующими фальсификации, во многом уникальны и в будущем, как мне кажется, способны привнести серьезный вклад в данную исследовательскую сферу. Однако на сегодняшний день с сожалением приходится констатировать, что данные поиски не отвечают требованиям современного научного метода: а значит, к ним стоит относиться с высокой степенью осторожности, как говорится, без излишнего фанатизма. Из трех аргументов, которыми пользуются исследователи, чтобы доказать фальсифицированность выборов, в реальности рабочим оказывается только один:…….. Гауссиана - фальсификация для доказательства фальсификации В период пост-выборного срача, в интернете появились несколько видов "математического доказательства" фальсификации выборов. Например вот такой график, так называемой "гауссианы". Впервые столкнувшись с гауссианой при анализе выборов, я впал в ступор. Я не математических наук доктор, а матанализ для меня давно законченный предмет из далекого университетского времени. Но я всегда считал, что с математикой и логикой у меня лады - мне часто приходится иметь дело с функциями по работе, приходится думать над логикой работы больших систем в веб проектах - тренировка есть. Но тут я почувствовал себя дураком - я читаю комментарии "математического доказательства", которые изобилуют уверенностью в своей правоте. Даже те, кто умом, на вид, не отличается - и те похоже все поняли. А я сижу и вижу только лишь гистограмму, которая сообщает нам бессмысленную статистику. При чем здесь гауссиана? Как вообще можно применять гауссиану в качестве социологического исследования? Рисовка голосов и хитрые матфункции в статистике Математические распределения и выборы в ГосДуму 2011 (ОПРОВЕРЖЕНИЕ популярного заблуждения) (а также, ЧАСТИЧНОЕ ОПРОВЕРЖЕНИЕ ОПРОВЕРЖЕНИЯ) Сеть заполонили спекуляции на тему аномального распределения процента голосов за ЕдРо по участкам. Например, [lleo.me], [www.gazeta.ru] и т.д. При этом, «эксперты»-математики, пытающиеся объяснить народу весь ужас того, как нагло его обманывают власти, на самом деле в лучшем случае никакие не эксперты, т.к. допускают грубые математические ошибки, а в худшем — сами нагло врут и подтасовывают факты…. Разбор статистических п(р)олётов Ложь и наглую ложь для развала России уже применяли, теперь вот пошла в ход статистика. anpaza публикует в своём ЖЖ несколько ссылок под общим названием "Опровержение статистических доказательств "избирательных фальсификаций". Любопытно, что по одной из ссылок рассматриваются данные выборов в бундестаг. Я предлагал сделать нечто подобное несколько дней назад в комментариях к рассказу о подлоге доказательств одной из якобы фальсификаций. Любопытно также, что всё те же статистические псевдодоказательства фальсификаций использовались и после выборов 2007-го года. Но на этот раз к их раскрутке подготовились заранее (так же, как и ролики заранее наснимали) и совершенно понятно, что в дело бы они пошли при совершенно любом исходе выборов. "Лестница Чурова" как символ веры образованщины Попробую забить последний гвоздь в гроб так называемой "гребёнки Чурова", она же "лестница Чурова". Итак, масса людей умножает, делит, интегрирует и логарифмирует данные из БД ГАС "Выборы", пытаясь "отсеять фальшивые голоса" и получить "реальный процент ЕР". Признаюсь, меня поначалу тоже впечатлил график "лестницы Чурова", пока я не прочитал дельный пост, в котором автор нащупал причину, приводящую к такому эффекту. Объяснение было настолько простым, что я даже удивился, почему никто раньше до этого не додумался: всё дело в ошибках квантования. Из-за того, что количество проголосовавших, как и размер избирательного участка (количество зарегистрированных на участке избирателей) являются целыми числами, дроби вида X/Y, Как вырастает хвост Оригинал взят у awas1952 в Как вырастает хвост В ходе обсуждения формы графиков, построенных по результатам выборов, Canis Sapiens отмечает: ""Аномальному" хвосту есть очень простое объяснение: плохой учёт избирателей. Данные участков, где избиратели дополнительно вносились в список, сдвигают явку к большим значениям. Вообще зависимость чего-либо от списочного количества избирателей строится в предположении, что списочное количество избирателей на участке - правильная величина, либо что она изменяется в целом по РФ равномерно, что на самом деле не так. Списки создаются по данным местных администраций и т.п.. Недавно проходила перепись. На Росстате есть данные по оценке численности населения по всем мало-мальски крупным населённым пунктам и по всем районам всех субъектов РФ ДО переписи и есть результаты переписи (практически на одну дату). Например, видно, что по Москве не учтено было около 10% населения, также хорошо прибавили Московская область, национальные республики. Достаточно просто сравнить данные. Это сравнение, с моей точки зрения, однозначно показывает, каково качество цифр списочного состава УИК. Здесь есть графики по ТИК по последним выборам: [eugenyboger.livejournal.com] По-моему, наблюдается однозначная корреляция: если население региона по переписи больше оценочного ДО переписи, то наблюдается "аномальный" хвост, а если население уменьшилось, то хвоста не наблюдается. Поскольку в РФ нет дополнительных списков, то мне, например, представляется совершенно некорректным использование "метода Шпилькина" применительно ко всей РФ. Его, с моей точки зрения, можно использовать только в тех регионах/городах/районах, где численность населения по переписи не больше численности ДО переписи" (я уточнил расстановку знаков препинания). Графики с точки зрения социолога и математика andreyoid и isk_and_er указывают мне на некоторые сомнения одного из сотрудников "Левада-центра" в доказательности графика, используемого для постановки достоверности выборов под сомнение, и на подробное математическое исследование всех популярных нынче графиков с весьма интересным обсуждением этого исследования. Исследователь -- лауреат международного конгресса математиков -- приводит, в частности (в шестом пункте исследования), и тот график, чей смысл я долго не понимал -- всплески числа участков, где за ЕР подано круглое число процентов голосов -- и также отмечает, что "даже вбросы бюллетеней и приписки непонятно как могут объяснить такую странную форму". Математика голосования cruel_rasp указывает на статью Чурова В.Е. (того самого!), Арлазарова В.Л., Соловьёва А.В. "Итоги выборов. Анализ электоральных предпочтений". На материале статистики голосования за президента РФ в 2008-м году показано: разные типы населённых пунктов РФ формируют несколько заметно различных распределений по явке и предпочтениям, и наложение этих распределений даёт картину, никоим образом не соответствующую статистике, возможной в строго однородном обществе. Полагаю, если бы авторы удосужились шире популяризировать свои исследования, организовать шабаши в Интернете и на нескольких московских площадях было бы заметно сложнее: значительная часть протестующих в России всё ещё -- невзирая на четвертьвековые реформаторские усилия -- способна понимать очевидные закономерности. чисто посмеяться Распределение участков по явке Во-первых нормального распределения (распределения Гаусса) в случае когда случайная величина (в данном случае — явка) по определению принимает значения только в определенном диапазоне быть не может + нормальное распределение, вообще говоря, симметрично, тут надо говорить о чем-то вроде бета-распределения или логит-нормального распределения (не знаю как по-людски называется) (это все не очень важно, просто для справки любителям помянуть «гауссиану» к месту и не к месту). Во-вторых, причудливая форма распределения может объясняться неоднородностью электората. Для примера, вот распределение для выборов в бундестаг 2002 (данные отсюда [www.bundeswahlleiter.de] , только по избирательным округам)…….. автор Dobryаk Квантовая гребенка интересна и вполне способна сдвинуть с места мозги обитателей палаты номер шесть --- их и в обществе, и на этой ветке ГА хватает. Меня смущает только то, что на эту ветку пришелся дикий выброс квантовой гребенки из этой палаты. Где машины "Скорой помощи", чтобы они тут лбы о пол не расшибали, негуманно это, гораздо комфортабельнее и гуманнее зафиксировать их в койках с мягкими матрасами. Впрочем, любой санитар знает, что настоящий интерес представляет площадь под гребенкой: проведите вначале гладкую кривую по распределению --- в старые времена под такую задачу у каждого школьника в готовальне лежало лекало. И увидите, что площадь под квантовыми пиками просто мизер против общей площади под полным распределением: Ergo: (1) тезис о "массовых" манипуляциях ничтожен в силу ничтожности площади под квантовыми пиками, и пить который раз подряд этот "компот" уже просто непристойно. (2) жулику греет душу какая-нидь круглая цифра, так что квантовые пики несомненно говорят о мухлеже на отдельных участках. Было бы пристойно кой-кому шаловливые пальчики поотломать, или и руки вообще поотрывать... Но если кто усомнился, что сержант неправ, то читайте пункт (1) выше и заткнитесь же наконец-то. ……… автор: PH55 Таки эта самая квантовая гребёнка имеет место быть. Я собственноручно построил гистограммы результатов выборов с шагом 0,1%. Вот что получилось Я просмотрел результаты на участках, та много результатов со значением 50%. В основном это мелкие участки до 200 проголосовавших (а таких у нас что-то около трети, хотя по общему количеству проголосовавших там меньше 10%). Представим себе такую гипотетическую ситуацию. Предположим, что количество проголосовавших на каждом участке не должно превышать 10 человек. В таком случае возможно получить 33 различных результата. Всего. Если считать все эти результаты равновероятными, то самыми частыми будут результаты 100% и 0% (с вероятностью 15,38% каждый). Далее с вероятностью 7,69% следует результат 50%, а затем с вероятностью 4,62% результаты 33,3% и 66,7%. Если построить гистограмму с шагом 0,1%, то из 1000 точек 967 будут нулевыми, а в 32 будут те самые гребни, самый большой из которых в точке 50%. Если ограничить размер участка числом 100, то все значения гребней будут примерно в 10 раз меньше, что тоже весьма заметно. У нас, конечно, не 100 человек на участке, а несколько побольше. Но и результаты, выраженные в процентах, сосредоточены в некоторой области. Если присмотреться, то видны пики в точках 33,3%, 0,25%, 0,2%, 0,67%, 0,75%. Причём у всех партий. Но в точке 50% у ЕР самый большой гребень, так как именно около этого значения больше всего результатов. Так что эти гребни не чья-то злая воля и не дело случая. Это следствие ограниченности объёма избирательных участков. И чем мельче участки, тем более явно выражены эти гребни. |