kobak: (Default)
[personal profile] kobak
Появление первых данных Росстата за 2021 поломало мой скрипт, и мне так быстро его не починить. Но скрипт по всем странам продолжает работать, поэтому вот:



Россия в первой строке, четвертая справа. Общая избыточная смертность до января 2021 -- 410 тысяч.

Недоучет за январь составил всего 3.5. Вообще, избыточная смертность в январе гораздо меньше декабрьской, в т.ч. потому что в январе сильно выше baseline. От демографов я слышал, что январский пик смертности связан с употреблением водки на новый год, но я что-то в этом сомневаюсь и подозреваю, что он скорее связан с гриппом. В этом году из-за социального дистанцирования гриппа почти нет, поэтому избыточная смертность может недооценивать ковидную смертность. Февраль покажет, был ли я прав.

Update: в комментариях вроде бы разобрались -- обычно в январе где-то 10 тысяч (!) смертей от алкоголя на праздники и еще где-то столько же от гриппа и последствий (как и в феврале-марте).

Повешу еще вот этот график, который раньше тут не показывал:



https://github.com/dkobak/excess-mortality

Date: 2021-04-05 11:05 am (UTC)
From: [identity profile] kobak.livejournal.com
Вы не могли бы все-таки пояснить, что именно означает 3.9% коррекция смертности 2018? Мой расчет ("в 2018 умерли 1827827 человек, если умножить на 1.039, то получится 1899112") — это то, что Вы имели в виду, или нет?

На остальное потом отвечу.

Date: 2021-04-05 12:25 pm (UTC)
From: [identity profile] Денис Витман (from livejournal.com)
Это насколько должна была бы вырости смертность из-за старения населения. Так как нам известно, что этот фактор в 2020 действовал и усилился с 2018.

Рассчитывается следующим образом:
1. Берем одинаковые коэффициенты смертности по поло-возрастным группам (я взял 2014 год — последние опубликованные)
2. Накладываем на поло-возрастную структуру населения на интересующий год.
3. Смотрим, какая доля населения должна была бы умереть в 2020. Сравниваем эту долю с теми, кто должен был бы умереть в 2018 (то есть это не реальная смертность — а модельная, но при одинаковых коэффициентах смертности). Разница — определяет влияние чистого старения населения (без учета всех других факторов — от Ковида до мягких зим и улучшения медицины).

За 2019-2020 год население постарело настолько, что если бы в 2018 и в 2020 были бы одинаковые коэффициенты смертности по каждой поло-возрастной группе — то в 2020 году умерло бы на 3.9% больше людей (чуть больше 70 000).

Date: 2021-04-05 12:44 pm (UTC)
From: [identity profile] kobak.livejournal.com
ОК, но это означает, что "в 2018 умерли 1827827 человек, если умножить на 1.039, то получится 1899112" — это и есть расчет, который Вы имеете в виду, да? Вы не могли бы просто сказать "да", если это так?

Date: 2021-04-05 12:59 pm (UTC)
From: [identity profile] Денис Витман (from livejournal.com)
Да. :) Простите, я думал вы спросили откуда взялся коэффициент.

Date: 2021-04-05 04:34 pm (UTC)
From: [identity profile] kobak.livejournal.com
ОК. То есть Ваше предсказание гипотетической без-ковидной смертности на 2020 находится примерно посередине смертности 2015 и 2016.

Image

По-моему, это совершенно ясно опровергается реальной смертностью в январе-феврале-марте 2020 года.

Date: 2021-04-05 08:34 pm (UTC)
From: [identity profile] Денис Витман (from livejournal.com)
Согласен, это аргумент. Но не очень сильный.

Январь и февраль 2018 — равен 2020.

Как мы знает зима 2019 — 2020 был очень теплой и весна пришла рано, а вот март 2018 — наоборот очень холодный. Не объясняет ли это 17 000 смертей разницы между 2018 или 2020 в марте? Если мы можем объяснить 30 000 жарой в июле на относительно мало-населенном Урале?

Вот например еще несколько примеров:
Май 2015 — равен маю 2019 (при 5 годах снижения смертности)
А апрель 2017 — на 10-15 тысяч ниже апреля 18-19 и 20.

В общем как аргумент принимается. Но если вы посмотрите — у нас стандартное отклонение для первого квартала — 33 000. Так что изменение в 18 000 за квартал — скорее намек, чем доказательство. В 2013, 2008 ну и 2015 (что не корректно из-за Крыма) — первый квартал давал большую смертность, чем в предыдущем году....

В общем все равно гораздо корректнее говорить о диапазоне

Date: 2021-04-05 09:25 pm (UTC)
From: [identity profile] kobak.livejournal.com
Да, я согласен, что это не док-во. Честно говоря, не знаю, возможны ли тут вообще какие-то доказательства. Хотелось бы сказать, что ладно, ковид закончится — тогда и посмотрим, будет смертность дальше падать (от 2019) или начнет расти. Но ведь и то, и другое можно будет списать на последствия эпидемии (если будет падать, то т.к. "всех слабых уже выкосил ковид"; если будет расти, то "социальные/экономические последствия локдаунов"). Так что не знаю, можно ли этот академический диспут как-то разрешить.

Мой главный тезис состоит в том, что Ваш аргумент основывается на большом кол-ве разнодействующих факторов: (1) 15-летнее уменьшение смертности себя исчерпало; (2) увеличение кол-ва пожилых людей сменило уменьшение смертности на рост; (3) этот эффект невозможно увидеть на моем графике, из-за того что в 2019 году неясная аномалия привела к снижению смертности, хотя без нее был бы рост относительно 2018; (4) очень теплая зима начала 2020 года привела к тому, что смерность в первые три месяца снизилась еще дальше, хотя без этого должна была бы вырасти до уровня 2015-16 годов.

Т.е. Вам, для того чтобы согласовать Вашу гипотезу (пункты 1-2) с наблюдаемыми фактами, нужно привлечь аж две разные аномалии: летнюю аномалию 2019 года (пункт 3) и зимнюю аномалию начала 2020 года (пункт 4).

Я не могу всё это опровергнуть, но по итогам нашего разговора остаюсь не убежден :-)

------------------

Насчет диапазона я, конечно, согласен. Моя линейная модель предсказывает падение смертности на 30 тысяч в год, и при этом дает стандартное отклонение предсказания около 30 тысяч тоже. Т.е. чтобы получить 95% интервал, нужно взять плюс минус 60 тысяч. И это чисто статистическая неопределенность, которая исходит из линейной модели, т.е. с линейной моделью согласуется всё от 2019 смертности минус 90 тысяч, до плюс 30 тысяч. Но, конечно, не смертность 2015-16 годов (это было бы 2019 плюс 100 тысяч).

PS "Если мы можем объяснить 30 000 жарой в июле на относительно мало-населенном Урале" — по моим оценкам, на июльскую жару приходится тысяч 10 максимум, остальное — ковид.

Date: 2021-04-06 08:07 am (UTC)
From: [identity profile] Денис Витман (from livejournal.com)
Смотрите — старение население и достижение европейских уровней по внешним причинам — это тоже наблюдаемые факты. Скорее моя гипотеза говорит о том, что так или иначе смертность повысилась бы. Возможно это произошло бы в 2021 году — с первой же крепкой зимой. И жалуюсь не нехватку фактов — а именно нормальных таблиц смертности и на нехватку адекватного анализа по факторам смертности от наших демографов.

Использовании чисто статистической модели при условии серьезных разбросов и аномалий внутри (а летняя аномалия 2019 — это не моя выдумка — при множестве слабых факторов таких аномалий быть не должно — а значит есть ограниченного количество сильных внешних факторов) дает очень относительные результаты.

PS. Июль — на 20т больше июня и больше августа. Насколько я помню пик первой волны закончился в июне.

Date: 2021-04-06 08:39 am (UTC)
From: [identity profile] kobak.livejournal.com
Что нормальных данных по смертности нет — это никуда не годится, тут я полностью согласен.

> летняя аномалия 2019 — это не моя выдумка

В каком смысле? Про нее можно где-то почитать? Я вообще не очень понимаю, как может быть летняя аномалия, которая приводит к уменьшению смертности.

> Июль — на 20т больше июня и больше августа.

Да, на общей кривой выбиваются из июня/августа примерно тысяч 20, но если мы говорим о жаре, то нужно смотреть на географию этой самой жары, и суммировать избыточную смертность по регионам, которые эту жару испытали (погоду июля прошлого года в любом городе найти нетрудно). Это должна быть группа соседних регионов. Я это упражнение один раз проделал и у меня получилось в районе 10 тысяч, но не настаиваю на этом результате — не очень внимательно тогда анализировал.

Но опять же — не знаю, почему я эти оценки делаю, а не Росстат.

Image (https://ic.pics.livejournal.com/kobak/1474765/50104/50104_original.png)
Edited Date: 2021-04-06 08:41 am (UTC)

Profile

kobak: (Default)
kobak

May 2026

S M T W T F S
     12
3456789
10111213 141516
17181920212223
24252627282930
31      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 23rd, 2026 05:26 am
Powered by Dreamwidth Studios