недоразброс
Apr. 27th, 2022 01:12 amПо-прежнему не знаю, как правильно перевести на русский язык термин underdispersion. Предлагаю "недоразброс". Проверил сейчас в гугле ("Your search - недоразброс - did not match any documents") и Яндексе ("По вашему запросу ничего не нашлось") -- ноль результатов, так что застолблю понятие.
Так вот, в журнале Significance вышла моя статья о недоразбросе в официальной ковидной статистике: https://rss.onlinelibrary.wiley.com/doi/10.1111/1740-9713.01627. Я об этом уже писал год назад (https://kobak.livejournal.com/119745.html), но объясню еще раз. Возьмем кол-во ковидных смертей, которые Россия сообщала в первую неделю сентября 2021 года: 792, 795, 790, 798, 799, 796, 793. Среднее: 795, дисперсия: 11. Если бы это была Пуассонова случайная величина, то дисперсия равнялась бы среднему. Т.е. мы наблюдаем недоразброс (по отношению к Пуассону). Для сравнения, США в ту же неделю рапортавали 1461, 1185, 1202, 1795, 2010, 2003, 1942 смерти. Среднее: 1657, дисперсия: 135470. Т.е. тут наблюдается переразброс (overdispersion). В переразбросе ничего странного нет: эпидемия растет; на выходных сообщают меньше смертей; мало ли еще какие коррелированные флуктуации происходят. Но вот для недоразброса никаких приличных объяснений не придумать, кроме очевидного объяснения: кто-то очень не хотел, чтобы число смертей перевалило за 800. (Насыщением тестирования это не объяснить, т.к. речь идет о ковидных смертях, а не о заражениях).

Дальше я взял все 237 стран из базы данных ВОЗ и с помощью бутстрапа протестировал 100 недель не недоразброс. 18 стран показали статистически значимый недоразброс, в т.ч. и Россия. Особенно мне нравится Никарагуа, которая весь 2021 год рапортовала одну ковидную смерть в неделю: 52 смерти за 52 недели, ровно по одной смерти в неделю (это недоразброс не в дневных смертях, а в недельных). Ежу понятно, что это нарисованные числа.

Между недоразбросом (среднее/отклонение, т.е. величина обратная Fano factor) и недоучетом (избыточная смертность / официальная смертность) видна хорошая корреляция. На графике я специально отметил Украину и Россию, для сравнения. В Украине недоразброса нет, недоучет в пределах разумного (1.8). В России адский недоразброс и сильный недоучет (3.3).

В Украине считают честно, а в России всё построено на лжи.
Update: в комментариях верно напоминают, что статистика общей смертности в России очень хорошая и надежная, так что всё-таки не совсем всё построено на лжи.
---------
Статья: https://rss.onlinelibrary.wiley.com/doi/10.1111/1740-9713.01627
Код: https://github.com/dkobak/covid-underdispersion
В твиттере: https://twitter.com/hippopedoid/status/1518862282494824448
В журнале Экономист про это вышла классная статья: https://www.economist.com/graphic-detail/2022/02/25/are-some-countries-faking-their-covid-19-death-counts с гениальным подзаголовком: "More equal than others".
Так вот, в журнале Significance вышла моя статья о недоразбросе в официальной ковидной статистике: https://rss.onlinelibrary.wiley.com/doi/10.1111/1740-9713.01627. Я об этом уже писал год назад (https://kobak.livejournal.com/119745.html), но объясню еще раз. Возьмем кол-во ковидных смертей, которые Россия сообщала в первую неделю сентября 2021 года: 792, 795, 790, 798, 799, 796, 793. Среднее: 795, дисперсия: 11. Если бы это была Пуассонова случайная величина, то дисперсия равнялась бы среднему. Т.е. мы наблюдаем недоразброс (по отношению к Пуассону). Для сравнения, США в ту же неделю рапортавали 1461, 1185, 1202, 1795, 2010, 2003, 1942 смерти. Среднее: 1657, дисперсия: 135470. Т.е. тут наблюдается переразброс (overdispersion). В переразбросе ничего странного нет: эпидемия растет; на выходных сообщают меньше смертей; мало ли еще какие коррелированные флуктуации происходят. Но вот для недоразброса никаких приличных объяснений не придумать, кроме очевидного объяснения: кто-то очень не хотел, чтобы число смертей перевалило за 800. (Насыщением тестирования это не объяснить, т.к. речь идет о ковидных смертях, а не о заражениях).

Дальше я взял все 237 стран из базы данных ВОЗ и с помощью бутстрапа протестировал 100 недель не недоразброс. 18 стран показали статистически значимый недоразброс, в т.ч. и Россия. Особенно мне нравится Никарагуа, которая весь 2021 год рапортовала одну ковидную смерть в неделю: 52 смерти за 52 недели, ровно по одной смерти в неделю (это недоразброс не в дневных смертях, а в недельных). Ежу понятно, что это нарисованные числа.

Между недоразбросом (среднее/отклонение, т.е. величина обратная Fano factor) и недоучетом (избыточная смертность / официальная смертность) видна хорошая корреляция. На графике я специально отметил Украину и Россию, для сравнения. В Украине недоразброса нет, недоучет в пределах разумного (1.8). В России адский недоразброс и сильный недоучет (3.3).

В Украине считают честно, а в России всё построено на лжи.
Update: в комментариях верно напоминают, что статистика общей смертности в России очень хорошая и надежная, так что всё-таки не совсем всё построено на лжи.
---------
Статья: https://rss.onlinelibrary.wiley.com/doi/10.1111/1740-9713.01627
Код: https://github.com/dkobak/covid-underdispersion
В твиттере: https://twitter.com/hippopedoid/status/1518862282494824448
В журнале Экономист про это вышла классная статья: https://www.economist.com/graphic-detail/2022/02/25/are-some-countries-faking-their-covid-19-death-counts с гениальным подзаголовком: "More equal than others".