kobak: (Default)
[personal profile] kobak
Внезапно с опережением графика появились ноябрьские данные от Росстата (картинки увеличиваются по клику).



Избыточная смертность с апреля по ноябрь -- 264 тыс. Число смертей, которые ежедневно рапортует оперативный штаб, за тот же период составило всего 40 тыс., так что в 6.5 раз меньше. По данным Росстата, за тот же период произошло 59 тыс. смертей от подтвержденного коронавируса, и 116 тыс. (включая уже упомянутые 59 тыс.) были связаны с коронавирусом.

В разных регионах все это выглядит очень по-разному. В Башкортостане, например, избыточная смертность в 115 раз выше кол-ва смертей по данным оперативного штаба:



На анимации хорошо видно распространение вируса по стране:



Ну и наконец сравнение с другими странами (оценки избыточной смертности тут взяты из Economist и NYT). "Коэффициент занижения" 6.5 (отношение избыточной смертности к оперативным данным -- тем, которые обновляются ежедневно) -- с большим отрывом самый большой из всех стран, по которым есть данные об избыточной смертности. **В предположении**, что этот коэффициент останется таким же, избыточная смертность в России **на сегодня** составила ~360 тыс., т.е. на втором месте после США, где уже ~450 тыс. Per capita в РФ это 0.25%, примерно как в Мексике/Перу/Эквадоре/Боливии.



Впрочем, нужно помнить, что в Перу/Эквадоре/Боливии население гораздо моложе, чем в РФ, поэтому избыточная смертность в процентах от обычной годовой смертности там гораздо выше: https://kobak.livejournal.com/117436.html.

Update (Dec 30): Данные, код и все картинки теперь на https://github.com/dkobak/excess-mortality.

Date: 2020-12-29 12:16 pm (UTC)
From: [identity profile] kobak.livejournal.com
264 -- это с апреля по ноябрь, да, это была опечатка (уже исправил).

Сверхсмертность в январе--апреле была почти на нуле. Январь: +500, февраль: +1500, март: -3900.

Про поправку не очень понял, а зачем ее делать и как? Какую поправку?

Date: 2020-12-29 04:11 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Смертность при одном и том же возрастном составе населения и состоянии медицины сильно зависит от времени года. Разные причины смертности выстреливают в разное время, но в результирующий максимум приходится на зиму. Если Вы считали тренд только по отрезкам апрель–ноябрь разных лет, то, как бы, ладно. Если же по всем данным, то надо вводить поправки. на сезонность. Я не считал сверхсмертость для начала года цифрами, но, судя по графикам, она отрицательна, из-за того, что прошлая зима оказалась мягче предыдущих.

Date: 2020-12-29 04:14 pm (UTC)
From: [identity profile] kobak.livejournal.com
Моя "модель" -- это линейный эффект года плюс categorical effect месяца. Так что сезонность учитывается автоматически.

Date: 2020-12-29 04:17 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Не знаю, как оно на русский переводится, но догадываюсь, о чём речь. Но тогда вопрос: а как Вы его считаете? Доступных данных Росстата, стартующих только с декабря 2014 г., для этого маловато…

Date: 2020-12-29 04:58 pm (UTC)
From: [identity profile] kobak.livejournal.com
Тут я просто посчитал линейный тренд по среднему за год за 2015-19, взял месячные отклонения от среднего и посчитал медиану в каждом месяце за 2006-19. Иллюстрации:

Image

Image

Но можно просто взять данные за 2015-19 и честно зафитить линейную модель с одним коэфф для года и 12 коэфф для месяцев. Так я делал в предыдущей записи, где все страны вместе. Получается примерно то же самое.

Date: 2020-12-29 05:19 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Ну, может быть, действительно, сверсмертность столь высока, что всё равно, как считать. Но вообще-то это делается так. Берётся относительное отклонение месяца от среднего по году вокруг этого месяца. И вот для этой штуки – медиана. Но, как я уже сказал, тут маловато лет есть. Конечно, можно взять более длинные (докрымские) данные, но там свои грабли будут.

Date: 2020-12-29 09:01 pm (UTC)
From: [identity profile] kobak.livejournal.com
Ну так я же ровно это и написал. И медиану считаю с 2006 по 2019, чтобы было побольше данных.

Date: 2020-12-30 05:41 am (UTC)
From: [identity profile] tov-y.livejournal.com
По-моему, Вы написали не совсем это или даже совсем не, хотя, ещё раз, наверно, в данном случае это не очень принципиально.
Но меня больше интересуют непрерывные данные с 2006 по 2019. Это откуда?

Date: 2020-12-30 05:11 pm (UTC)
From: [identity profile] kobak.livejournal.com
https://www.fedstat.ru/indicator/33556

Date: 2020-12-30 06:18 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Ахренеть!
Найти в этой системе такие данные - круть неземная.
Спасибо!

Date: 2020-12-30 06:37 pm (UTC)
From: [identity profile] kobak.livejournal.com
Мне эту ссылку несколько месяцев назад дал в твиттере Михаил Зеленский.
(deleted comment)

Date: 2021-01-05 02:16 pm (UTC)
From: [identity profile] kobak.livejournal.com
Разница не очень большая, но все же существенная.

Но сравнивать с 2019 -- тоже нормальный вариант.

Date: 2021-01-05 02:26 pm (UTC)
From: [identity profile] tov-y.livejournal.com
Пока мы оперируем годами, примерно всё равно, как считать.
Сложности начинаются при переходе к месячным данным.

Опять 3%

Date: 2020-12-30 08:28 am (UTC)
From: [identity profile] electronicseeds.livejournal.com
Високосный февраль всё портит :(

Date: 2020-12-30 08:38 am (UTC)
From: [identity profile] kobak.livejournal.com
По уму надо бы сделать линейный эффект кол-ва дней в месяце (с учетом високосности) плюс плавный эффект сезонности кубическим сплайном. Может быть, займусь!

Profile

kobak: (Default)
kobak

May 2026

S M T W T F S
     12
3456789
10111213 141516
17181920212223
24252627282930
31      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 23rd, 2026 04:04 pm
Powered by Dreamwidth Studios