Сергей Шпилькин прислал свежевыкачанные с сайта ЦИК данные. Вот как выглядят в этом году пики. (Историю вопроса см. в https://projecteuclid.org/euclid.aoas/1458909907)

Update: Вижу, что ссылка на эту запись попала в https://navalny.com/p/5818, поэтому стоит, наверное, дать некоторые дополнительные пояснения. Сверху -- гистограмма явки, с бином 0.1%. Вместо того, чтобы просто считать кол-во участков в каждом бине, я считаю суммарное кол-во избирателей, зарегистрированных на этих участках (иными словами, участки взвешены по размеру). Снизу -- гистограмма результата Путина, построенная таким же образом. Гребенка пиков на целых значениях, особенно заметная в районе 80--100% явки, -- это свидетельство фальсификаций, при которых явка и/или результат подгоняются под некий выдуманный процент. Пики значительно заметнее на гистограмме явки, что, наверное, может означать, что рисованию явки в среднем придавали большее значение. Отмечу, что пики происходят из нескольких конкретных регионов, см. вот эту картинку (полюбуйтесь, например, на Дагестан, Татарстан или Краснодарский край).
Как аналогичные графики выглядели в прошлом, можно посмотреть в нашей статье на эту тему, ссылка выше.
Эти графики *НЕ* предназначены для того, чтобы оценивать "несфальсифицированные" результаты. Аккуратно такую оценку можно попытаться сделать, только если внимательно разбираться с каждым регионом отдельно. Но крайне приблизительно можно сказать, что "настоящие" явка и результат Путина находятся в районе максимума (моды) этих гистограмм, т.е. где-то 62% явка и 74% результат. Официальные числа составляют 67.5% и 76.7% соответственно. Озвученная штабом Навального оценка "настоящей" явки в 55% мне представляется сильно заниженной; надеюсь, они разберутся, почему она занижена и как-то это скорректируют (у них, очевидно, сильно смещенная выборка, и они это наверняка и так учитывают, но надо, я думаю, учитывать аккуратнее). Update 2: Цифра в 55% прояснилась: она не включала надомное (и досрочное) голосование, а это, согласно данным ЦИК, почти 5 миллионов человек, т.е. еще почти 5%. Вместе получается ~60%, что в первом приближении соответствует тому, что я вижу в данных.
Дисклеймер: слово "настоящие" я ставлю в кавычки, т.к. на мой взгляд, эти выборы имеют мало отношения к свободному волеизъявлению, вне зависимости от объемов прямых фальсификаций.
Update 3: Вижу целый ряд оценок вбросов в 10 млн, что соответствовало бы реальной явке в 58%. Мне это кажется переоценкой в полтора-два раза.

Update: Вижу, что ссылка на эту запись попала в https://navalny.com/p/5818, поэтому стоит, наверное, дать некоторые дополнительные пояснения. Сверху -- гистограмма явки, с бином 0.1%. Вместо того, чтобы просто считать кол-во участков в каждом бине, я считаю суммарное кол-во избирателей, зарегистрированных на этих участках (иными словами, участки взвешены по размеру). Снизу -- гистограмма результата Путина, построенная таким же образом. Гребенка пиков на целых значениях, особенно заметная в районе 80--100% явки, -- это свидетельство фальсификаций, при которых явка и/или результат подгоняются под некий выдуманный процент. Пики значительно заметнее на гистограмме явки, что, наверное, может означать, что рисованию явки в среднем придавали большее значение. Отмечу, что пики происходят из нескольких конкретных регионов, см. вот эту картинку (полюбуйтесь, например, на Дагестан, Татарстан или Краснодарский край).
Как аналогичные графики выглядели в прошлом, можно посмотреть в нашей статье на эту тему, ссылка выше.
Эти графики *НЕ* предназначены для того, чтобы оценивать "несфальсифицированные" результаты. Аккуратно такую оценку можно попытаться сделать, только если внимательно разбираться с каждым регионом отдельно. Но крайне приблизительно можно сказать, что "настоящие" явка и результат Путина находятся в районе максимума (моды) этих гистограмм, т.е. где-то 62% явка и 74% результат. Официальные числа составляют 67.5% и 76.7% соответственно. Озвученная штабом Навального оценка "настоящей" явки в 55% мне представляется сильно заниженной; надеюсь, они разберутся, почему она занижена и как-то это скорректируют (у них, очевидно, сильно смещенная выборка, и они это наверняка и так учитывают, но надо, я думаю, учитывать аккуратнее). Update 2: Цифра в 55% прояснилась: она не включала надомное (и досрочное) голосование, а это, согласно данным ЦИК, почти 5 миллионов человек, т.е. еще почти 5%. Вместе получается ~60%, что в первом приближении соответствует тому, что я вижу в данных.
Дисклеймер: слово "настоящие" я ставлю в кавычки, т.к. на мой взгляд, эти выборы имеют мало отношения к свободному волеизъявлению, вне зависимости от объемов прямых фальсификаций.
Update 3: Вижу целый ряд оценок вбросов в 10 млн, что соответствовало бы реальной явке в 58%. Мне это кажется переоценкой в полтора-два раза.
no subject
Date: 2018-03-19 11:36 am (UTC)no subject
Date: 2018-03-19 01:04 pm (UTC)(no subject)
From: (Anonymous) - Date: 2018-03-19 03:32 pm (UTC) - Expand(frozen) no subject
Date: 2018-03-19 01:19 pm (UTC)(frozen) no subject
Date: 2018-03-19 01:23 pm (UTC)(frozen) (no subject)
From:no subject
Date: 2018-03-19 01:35 pm (UTC)no subject
Date: 2018-03-20 02:38 am (UTC)https://www.youtube.com/watch?v=j-yI_ono6JA&t=0s&list=PL39erB3ZaMTR4DZAGmkZ1P0xlS77pIIDF&index=25
no subject
Date: 2018-03-19 01:58 pm (UTC)no subject
Date: 2018-03-19 02:11 pm (UTC)Update: бегло посмотрел по регионам, ничего особенно на 57.9 нигде сходу не заметил, так что допускаю, что просто флуктуация.
(no subject)
From:(no subject)
From:no subject
Date: 2018-03-19 02:36 pm (UTC)no subject
Date: 2018-03-19 02:54 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(frozen) (no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2018-03-19 02:43 pm (UTC)А нельзя ли мне как-то получить сырые данные?
Ибо среди моих коллег и друзей не утихает спор по поводу того, что характерные пички могут иметь естественное происхождение. Хотелось бы самим поэкспериментировать с данными. Скинуть прошу на ящик LostTechInfinite собака Рамблер.ru.
Заранее спасибо!
no subject
Date: 2018-03-19 09:21 pm (UTC)(no subject)
From:(no subject)
From:no subject
Date: 2018-03-19 03:54 pm (UTC)Наличие странного кластера сверху первым заметил oude_rus.
no subject
Date: 2018-03-19 05:19 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2018-03-19 04:33 pm (UTC)no subject
Date: 2018-03-19 04:43 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2018-03-19 05:27 pm (UTC)no subject
Date: 2018-03-19 08:25 pm (UTC)И дальше вниз по ссылкам "Нижестоящие избирательные комиссии".
(no subject)
From:no subject
Date: 2018-03-19 06:07 pm (UTC)no subject
Date: 2018-03-20 10:57 am (UTC)(no subject)
From:no subject
Date: 2018-03-19 08:26 pm (UTC)Есть подозрение, что на общей явке пики более характерны, чем на графике за Путина из-за того, что явку обеспечивали вбросом не за Путина, а пустых (недействительных) бюллетеней.
no subject
Date: 2018-03-19 09:37 pm (UTC)Пусть даже мы живем в идеальной стране эльфов, где все участки одного размера n и с одинаковой вероятностью p все жители независимо приходят на них.
Тогда согласно локальной предельной теореме в зоне от x до x+d явки будет доля d c e^{- s (x-p)^2} участков , где s=n/(2pq), c - нормировочная константа.
Но количество голосов, которые эти участки принесли - dc x e^{-s (x-p)^2}, ведь каждый участок приносит по x голосов.
Это распределение ненормально и несимметрично, а скошено направо.
Откуда берется тезис о симметричности или тем более нормальности?
no subject
Date: 2018-03-19 09:40 pm (UTC)2. А разве я что-то писал про симметричность и/или нормальность?
no subject
Date: 2018-03-19 10:52 pm (UTC)не могли бы Вы чуть подробнее обьяснить, свидетельством какого именно действия являются целочисленные пики по явке?
no subject
Date: 2018-03-19 10:53 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:3.
From:практика подсчета голосов
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:, либо невероятны, либо не согласуются с наблюдаемыми
From:(no subject)
From:чисто умозрительно...
From:RE: чисто умозрительно...
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:чтобы всё пересчитать и дополнительно
From:(no subject)
From:no subject
Date: 2018-03-20 08:17 am (UTC)(Тут опущу стандартные слова о том, что нет, я не за путина, я вообще благодаря Навальному стал интересоваться политикой, бла-бла. В общем, я за адекватность и логичные аргументы)
Вот тут была довольно давно статья про эту самую "пилу чурова": https://vvaf.livejournal.com/885.html . Мне кажется, довольно правдоподобно, хотя мне и не нравится ватно-кургинянский стиль изложения.
no subject
Date: 2018-03-20 08:29 am (UTC)"Нафига это делать" -- я думаю, что никакой причины рисовать целые проценты нет, просто когда люди выдумывают проценты, то многие из них выдумывают круглые (или хотя бы целые) числа.
Что касается Вашей ссылки, то там речь идет о пиках, возникающих при делении маленьких целых чисел. Этот аргумент разобран много раз; он ВООБЩЕ НИКАК не может объяснить наблюдаемые в реальности пики. См. тут https://kobak.livejournal.com/102646.html, а если короче и по-английски, то тут https://projecteuclid.org/euclid.aoas/1458909907. Релевантный абзац вот:
We carefully checked that these peaks are not the artifacts of division of small integers [Johnston, Schroder and Mallawaaratchy (1995)]. Such artifacts can be observed in the election histograms if one chooses a very small bin size and counts polling stations directly instead of weighting them by registered voter counts (as we do). This allows small polling stations to contribute strongly to the distributions, leading to the artifact peaks at fractions with small denominators (such as 1/2, 2/3, 3/4, i.e., 50%, 66%, 75%). The peaks visible on Figure 4 are totally different from such artifacts, because (i) they are strictly periodic, (ii) they are never observed at 50% where the artifacts would be strongest, and (iii) they do not appear in Monte Carlo simulations that involve exactly the same type of integer divisions.
Соображения (i) и (ii) очень простые, наглядные и полностью опровергают "объяснение" в журнале vvaf.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(frozen) no subject
Date: 2018-03-20 09:04 am (UTC)(frozen) no subject
Date: 2018-03-20 09:09 am (UTC)по просьбам трудящихся...
Date: 2018-03-20 10:46 am (UTC)1. каков критерий порнографичности того или иного региона в смысле красивых процентов - как я понял, применен автоматический критерий, при срабатывании которого
ворота мажуться дегтемграфик региона перекрашивается в красный2. Если выкинуть наиболее порнографические результаты, пики на красивых процентах на национальной гистограмме исчезнут полностью или ослабнут (вариант - заметно ослабнут) ?
3. Понимаю, что ответов на эти вопросы Вы не знаете (пока, м.б.), но
- можно ли собрать такое подмножество регионов, исключение данных которых таки приведет к исчезновению пиков?
- сколько их нужно выкинуть для этого результата в 2018?
- сколько их нужно было выкинуть ранее (2011, 2012, т.д.)
4. Рисовальщики результатов на калькуляторе в прошлом прокалывались на количестве недействительных бюллетеней, демонстрируя полное непонимание необходимых манипуляций. Вы планируете изучить эту статистику для подозрительных регионов для сравнения с национальной ?
5. Я помню, что аномальные дисперсии данных ТИК'ов в 2012 были весьма показательны. Кто-нибудь сосчитал их для 2018, не встречали?
no subject
Date: 2018-03-20 11:33 am (UTC)2-3. Если выкинуть только семь регионов, то пики очень ослабнут, но какие-то, наверное, останутся. Думаю, если выкинуть штук 10-15, то исчезнут почти целиком. На детальное сравнение с прошлыми выборами было бы интересно взглянуть, но я его не делал (и не планирую).
4-5. Честно говоря, не планирую особо изучать эти выборы дальше. Думаю, kireev еще много интересного накопает. Но в регионах типа Дагестана и Башкортостана (где самые адские пики), всё наперекосяк, конечно.
(frozen) no subject
Date: 2018-03-20 01:27 pm (UTC)(frozen) no subject
Date: 2018-03-20 01:32 pm (UTC)no subject
Date: 2018-03-20 01:59 pm (UTC)no subject
Date: 2018-03-20 02:02 pm (UTC)no subject
Date: 2018-03-20 02:04 pm (UTC)no subject
Date: 2018-03-21 11:50 am (UTC)На всякий случай, цифра в 10 млн мне тоже кажется преувеличенной -- оценка по каждому раздельному региону, основанная на данных Шпилькина, дает 4.5 млн.
no subject
Date: 2018-03-21 11:58 am (UTC)Однако по официальным данным проголосовало 73,53 млн чел., т.е. имеется излишек в 9,61÷9,97 млн бюллетеней, или 13,1÷13,6% от официального количества проголосовавших. Таким образом, истинная явка, составляющая 58,3÷58,7%, завышена на 8,8÷9,2% пункта.
Т.е. они говорят именно о вбросе и оценивают реальную явку в 58%.
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2018-03-21 03:08 pm (UTC)no subject
Date: 2018-03-21 03:12 pm (UTC)no subject
Date: 2018-03-21 05:27 pm (UTC)no subject
Date: 2018-03-21 05:30 pm (UTC)(no subject)
From: (Anonymous) - Date: 2018-03-21 05:42 pm (UTC) - Expand(no subject)
From:(no subject)
From: (Anonymous) - Date: 2018-03-22 12:24 am (UTC) - Expandno subject
Date: 2018-03-23 11:52 am (UTC)no subject
Date: 2018-03-23 11:56 am (UTC)no subject
Date: 2018-03-24 03:44 pm (UTC)Самостоятельно поиграть со всеми данными
Date: 2018-03-24 05:47 pm (UTC)Основные цели и выводы отчёта:
1. Оценить результаты автоматического подсчёта (КОИБ) по сравнению с ручным.
В результатах автоматического подсчёта аномалий обнаружить пока не удалось.
2. Проиллюстрировать способы и результаты фальсификаций.
Вбросы/приписки, приводящие к аномалиям
- в зависимости от явки: чем выше явка, тем выше аномалии;
- при ручном подсчёте: некорректный подсчёт голосов за кандидатов, трактовка недействительных бюллетеней как действительных с передачей голосов кандидатам (на КОИБах не замечено);
- накрутка явки вплоть до 100%.
3. Оценить достоверные результаты.
Можно здесь по ссылке (https://goo.gl/i3y1tp).