росстат выложил данные за январь
Mar. 5th, 2021 05:24 pmПоявление первых данных Росстата за 2021 поломало мой скрипт, и мне так быстро его не починить. Но скрипт по всем странам продолжает работать, поэтому вот:

Россия в первой строке, четвертая справа. Общая избыточная смертность до января 2021 -- 410 тысяч.
Недоучет за январь составил всего 3.5. Вообще, избыточная смертность в январе гораздо меньше декабрьской, в т.ч. потому что в январе сильно выше baseline. От демографов я слышал, что январский пик смертности связан с употреблением водки на новый год, но я что-то в этом сомневаюсь и подозреваю, что он скорее связан с гриппом. В этом году из-за социального дистанцирования гриппа почти нет, поэтому избыточная смертность может недооценивать ковидную смертность. Февраль покажет, был ли я прав.
Update: в комментариях вроде бы разобрались -- обычно в январе где-то 10 тысяч (!) смертей от алкоголя на праздники и еще где-то столько же от гриппа и последствий (как и в феврале-марте).
Повешу еще вот этот график, который раньше тут не показывал:

https://github.com/dkobak/excess-mortality

Россия в первой строке, четвертая справа. Общая избыточная смертность до января 2021 -- 410 тысяч.
Недоучет за январь составил всего 3.5. Вообще, избыточная смертность в январе гораздо меньше декабрьской, в т.ч. потому что в январе сильно выше baseline. От демографов я слышал, что январский пик смертности связан с употреблением водки на новый год
Update: в комментариях вроде бы разобрались -- обычно в январе где-то 10 тысяч (!) смертей от алкоголя на праздники и еще где-то столько же от гриппа и последствий (как и в феврале-марте).
Повешу еще вот этот график, который раньше тут не показывал:

https://github.com/dkobak/excess-mortality
no subject
Date: 2021-04-05 11:05 am (UTC)На остальное потом отвечу.
no subject
Date: 2021-04-05 12:25 pm (UTC)Рассчитывается следующим образом:
1. Берем одинаковые коэффициенты смертности по поло-возрастным группам (я взял 2014 год — последние опубликованные)
2. Накладываем на поло-возрастную структуру населения на интересующий год.
3. Смотрим, какая доля населения должна была бы умереть в 2020. Сравниваем эту долю с теми, кто должен был бы умереть в 2018 (то есть это не реальная смертность — а модельная, но при одинаковых коэффициентах смертности). Разница — определяет влияние чистого старения населения (без учета всех других факторов — от Ковида до мягких зим и улучшения медицины).
За 2019-2020 год население постарело настолько, что если бы в 2018 и в 2020 были бы одинаковые коэффициенты смертности по каждой поло-возрастной группе — то в 2020 году умерло бы на 3.9% больше людей (чуть больше 70 000).
no subject
Date: 2021-04-05 12:44 pm (UTC)no subject
Date: 2021-04-05 12:59 pm (UTC)no subject
Date: 2021-04-05 04:34 pm (UTC)По-моему, это совершенно ясно опровергается реальной смертностью в январе-феврале-марте 2020 года.
no subject
Date: 2021-04-05 08:34 pm (UTC)Январь и февраль 2018 — равен 2020.
Как мы знает зима 2019 — 2020 был очень теплой и весна пришла рано, а вот март 2018 — наоборот очень холодный. Не объясняет ли это 17 000 смертей разницы между 2018 или 2020 в марте? Если мы можем объяснить 30 000 жарой в июле на относительно мало-населенном Урале?
Вот например еще несколько примеров:
Май 2015 — равен маю 2019 (при 5 годах снижения смертности)
А апрель 2017 — на 10-15 тысяч ниже апреля 18-19 и 20.
В общем как аргумент принимается. Но если вы посмотрите — у нас стандартное отклонение для первого квартала — 33 000. Так что изменение в 18 000 за квартал — скорее намек, чем доказательство. В 2013, 2008 ну и 2015 (что не корректно из-за Крыма) — первый квартал давал большую смертность, чем в предыдущем году....
В общем все равно гораздо корректнее говорить о диапазоне
no subject
Date: 2021-04-05 09:25 pm (UTC)Мой главный тезис состоит в том, что Ваш аргумент основывается на большом кол-ве разнодействующих факторов: (1) 15-летнее уменьшение смертности себя исчерпало; (2) увеличение кол-ва пожилых людей сменило уменьшение смертности на рост; (3) этот эффект невозможно увидеть на моем графике, из-за того что в 2019 году неясная аномалия привела к снижению смертности, хотя без нее был бы рост относительно 2018; (4) очень теплая зима начала 2020 года привела к тому, что смерность в первые три месяца снизилась еще дальше, хотя без этого должна была бы вырасти до уровня 2015-16 годов.
Т.е. Вам, для того чтобы согласовать Вашу гипотезу (пункты 1-2) с наблюдаемыми фактами, нужно привлечь аж две разные аномалии: летнюю аномалию 2019 года (пункт 3) и зимнюю аномалию начала 2020 года (пункт 4).
Я не могу всё это опровергнуть, но по итогам нашего разговора остаюсь не убежден :-)
------------------
Насчет диапазона я, конечно, согласен. Моя линейная модель предсказывает падение смертности на 30 тысяч в год, и при этом дает стандартное отклонение предсказания около 30 тысяч тоже. Т.е. чтобы получить 95% интервал, нужно взять плюс минус 60 тысяч. И это чисто статистическая неопределенность, которая исходит из линейной модели, т.е. с линейной моделью согласуется всё от 2019 смертности минус 90 тысяч, до плюс 30 тысяч. Но, конечно, не смертность 2015-16 годов (это было бы 2019 плюс 100 тысяч).
PS "Если мы можем объяснить 30 000 жарой в июле на относительно мало-населенном Урале" — по моим оценкам, на июльскую жару приходится тысяч 10 максимум, остальное — ковид.
no subject
Date: 2021-04-06 08:07 am (UTC)Использовании чисто статистической модели при условии серьезных разбросов и аномалий внутри (а летняя аномалия 2019 — это не моя выдумка — при множестве слабых факторов таких аномалий быть не должно — а значит есть ограниченного количество сильных внешних факторов) дает очень относительные результаты.
PS. Июль — на 20т больше июня и больше августа. Насколько я помню пик первой волны закончился в июне.
no subject
Date: 2021-04-06 08:39 am (UTC)> летняя аномалия 2019 — это не моя выдумка
В каком смысле? Про нее можно где-то почитать? Я вообще не очень понимаю, как может быть летняя аномалия, которая приводит к уменьшению смертности.
> Июль — на 20т больше июня и больше августа.
Да, на общей кривой выбиваются из июня/августа примерно тысяч 20, но если мы говорим о жаре, то нужно смотреть на географию этой самой жары, и суммировать избыточную смертность по регионам, которые эту жару испытали (погоду июля прошлого года в любом городе найти нетрудно). Это должна быть группа соседних регионов. Я это упражнение один раз проделал и у меня получилось в районе 10 тысяч, но не настаиваю на этом результате — не очень внимательно тогда анализировал.
Но опять же — не знаю, почему я эти оценки делаю, а не Росстат.