Коллеги, а никто не тестировал ежедневные сводки заболевших и умерших на underdispersion? Не знаю, как это правильно называется по-русски. Мое внимание в твиттере обратили на то, что Беларусь уже много дней рапортует кол-во умерших то 9, то 10 человек. Дисперсия такого набора чисел составляет примерно 0.25, т.е. *гораздо* меньше дисперсии распределения Пуассона со средним 9.5 (которая составляет те же 9.5). Понятно, что это явный признак нарисованных чисел.
Я взял ежедневное кол-во заболевших и умерших по данным университета Джонса Хопкинса по каждой стране, разбил на куски по 10 дней, в каждом посчитал среднее и дисперсию, сделал симуляцию пуассоновых выборок объемом 10 с таким средним, и объявил кусок _подозрительным_, если его дисперсия меньше, чем дисперсии 95% симуляций. Если у страны получилось больше трех подозрительных кусков, то назовем ее тоже подозрительной.
Вот как выглядит список подозрительных стран:
Здесь точки означают неподозрительные куски, а звездочки -- подозрительные. Перечислены только подозрительные страны. Сначала список подозрительных по статистике ковидных смертей, потом -- список подозрительных по статистике заболевших.
Беларусь вся в звездочках, как и предполагалось, но и другие страны в этом списке не то чтобы неожиданные.
Я взял ежедневное кол-во заболевших и умерших по данным университета Джонса Хопкинса по каждой стране, разбил на куски по 10 дней, в каждом посчитал среднее и дисперсию, сделал симуляцию пуассоновых выборок объемом 10 с таким средним, и объявил кусок _подозрительным_, если его дисперсия меньше, чем дисперсии 95% симуляций. Если у страны получилось больше трех подозрительных кусков, то назовем ее тоже подозрительной.
Вот как выглядит список подозрительных стран:
== DEATHS == Albania ...........*.....**..**....*...*. Algeria ......***..*.*.**.....*.*.....*.* Azerbaijan ..........***....****......**..*. Belarus .************.***....*.******** Egypt ..........*........*.*****.*..*** El Salvador ...........*..**...****..**.**. Kuwait ............*.*..*...*.*...... Moldova ........................****.... Saudi Arabia ..*.**..........*.**.*********. Serbia ...*...**....*..*..**.....**..** Syria ...............***.******..**** Turkey ..........******.****.**....*.*. United Arab Emirates....*....**.*..............*.... Uzbekistan ..........*****..*...*......... Venezuela .........****.*.****.******..** == CASES == Tajikistan .....*.***.*.*********.*....
Здесь точки означают неподозрительные куски, а звездочки -- подозрительные. Перечислены только подозрительные страны. Сначала список подозрительных по статистике ковидных смертей, потом -- список подозрительных по статистике заболевших.
Беларусь вся в звездочках, как и предполагалось, но и другие страны в этом списке не то чтобы неожиданные.