profile

росстат выложил данные за январь

Появление первых данных Росстата за 2021 поломало мой скрипт, и мне так быстро его не починить. Но скрипт по всем странам продолжает работать, поэтому вот:



Россия в первой строке, четвертая справа. Общая избыточная смертность до января 2021 -- 410 тысяч.

Недоучет за январь составил всего 3.5. Вообще, избыточная смертность в январе гораздо меньше декабрьской, в т.ч. потому что в январе сильно выше baseline. От демографов я слышал, что январский пик смертности связан с употреблением водки на новый год, но я что-то в этом сомневаюсь и подозреваю, что он скорее связан с гриппом. В этом году из-за социального дистанцирования гриппа почти нет, поэтому избыточная смертность может недооценивать ковидную смертность. Февраль покажет, был ли я прав.

Update: в комментариях вроде бы разобрались -- обычно в январе где-то 10 тысяч (!) смертей от алкоголя на праздники и еще где-то столько же от гриппа и последствий (как и в феврале-марте).

Повешу еще вот этот график, который раньше тут не показывал:



https://github.com/dkobak/excess-mortality
profile

пуассон 🐟

Коллеги, а никто не тестировал ежедневные сводки заболевших и умерших на underdispersion? Не знаю, как это правильно называется по-русски. Мое внимание в твиттере обратили на то, что Беларусь уже много дней рапортует кол-во умерших то 9, то 10 человек. Дисперсия такого набора чисел составляет примерно 0.25, т.е. *гораздо* меньше дисперсии распределения Пуассона со средним 9.5 (которая составляет те же 9.5). Понятно, что это явный признак нарисованных чисел.

Я взял ежедневное кол-во заболевших и умерших по данным университета Джонса Хопкинса по каждой стране, разбил на куски по 10 дней, в каждом посчитал среднее и дисперсию, сделал симуляцию пуассоновых выборок объемом 10 с таким средним, и объявил кусок _подозрительным_, если его дисперсия меньше, чем дисперсии 95% симуляций. Если у страны получилось больше трех подозрительных кусков, то назовем ее тоже подозрительной.

Вот как выглядит список подозрительных стран:

== DEATHS ==
Albania             ...........*.....**..**....*...*.
Algeria             ......***..*.*.**.....*.*.....*.*
Azerbaijan          ..........***....****......**..*.
Belarus             .************.***....*.********
Egypt               ..........*........*.*****.*..***
El Salvador         ...........*..**...****..**.**.
Kuwait              ............*.*..*...*.*......
Moldova             ........................****....
Saudi Arabia        ..*.**..........*.**.*********.
Serbia              ...*...**....*..*..**.....**..**
Syria               ...............***.******..****
Turkey              ..........******.****.**....*.*.
United Arab Emirates....*....**.*..............*....
Uzbekistan          ..........*****..*...*.........
Venezuela           .........****.*.****.******..**

== CASES ==
Tajikistan          .....*.***.*.*********.*....

Здесь точки означают неподозрительные куски, а звездочки -- подозрительные. Перечислены только подозрительные страны. Сначала список подозрительных по статистике ковидных смертей, потом -- список подозрительных по статистике заболевших.

Беларусь вся в звездочках, как и предполагалось, но и другие страны в этом списке не то чтобы неожиданные.
profile

Significance 2021

Вышла моя статья в журнале Significance про избыточную смертность в России с апреля по ноябрь. В открытом доступе. Большое спасибо Максиму П. и Сергею Ш. за советы и критику, а также всем комментаторам в моем жж за многочисленные обсуждения.

Excess mortality reveals Covid's true toll in Russia
https://rss.onlinelibrary.wiley.com/doi/10.1111/1740-9713.01486

Картинка оттуда для привлечения внимания:



Цвета пузырьков на карте показывают месяц, в котором избыточная смертность впервые превысила 25% от обычной смертности.

Данные и код, как обычно, тут: https://github.com/dkobak/excess-mortality
profile

(no subject)

Оформил ежемесячные пожертвования:

* Штабам Навального: https://shtab.navalny.com/#donate
* Медиазоне: https://donate.zona.media
* ОВД-инфо: https://donate.ovdinfo.org
* Апологии протеста: https://apologia.pro/#top

На сайте ФБК (https://donate.fbk.info) невозможно сделать пожертвование с иностранной карточки, поэтому перевожу Штабам, а не ФБК. Медиазоне можно оформить ежемесячный перевод по Paypal.

Всем предлагаю сделать то же самое. Подписаться можно на любую сумму. Все благотворительные фонды всегда говорят, что небольшая ежемесячная подписка лучше большой разовой.

[Комментарии от не-френдов скринятся]
profile

избыточная смертность по странам 2

Гигантский апдейт моего графика избыточной смертности по разным странам (https://kobak.livejournal.com/117436.html). Мне написал Ariel Karlinsky, который уже давно собирал данные общей смертности из кучи разных источников. Мы все это вместе немного причесали, свели в одну таблицу, пропустили через мой скрипт, и написали короткий текст.

Данные: https://github.com/akarlinsky/world_mortality
Анализ: https://github.com/dkobak/excess-mortality
Препринт: https://www.medrxiv.org/content/10.1101/2021.01.27.21250604v1



Полный размер по клику. Внимание, эта картинка загружается с гитхаба, где я ее регулярно обновляю, так что она будет меняться со временем.

Update: попали к Гельману в блог! https://statmodeling.stat.columbia.edu/2021/01/29/mortality-data-2015-2020-around-the-world
profile

YLL

В дискуссии об IFR в предыдущей записи mi_b написал: "[Н]еочевидно, что надо сравнивать смерти[,] а не годы потерянных жизней. Эти годы в разы выше для средней жизни, потерянной от гриппа". Эта запись -- попытка разобраться.

Речь идет о YLL, years of life lost, т.е. сколько лет жизни в среднем теряет каждый умерший от ковид19. Эту величину оценить очень трудно, по очевидной причине: нет подробных медицинских данных о каждом умершем. Тем не менее, люди пытаются. Например, тут:
https://www.pnas.org/content/117/36/22035
https://www.medrxiv.org/content/10.1101/2020.06.08.20050559v2.full-text
https://www.medrxiv.org/content/10.1101/2020.10.18.20214783v2.full-text
просто берут кол-во умерших от ковида в США по возрастным группам и полу, для каждой подгруппы находят ожидаемую продолжительность оставшей жизни, дальше усредняют, и готово. В этих трех работах получается 12 лет, 11 лет, 13 лет.

Такой подсчет -- это грубая верхняя оценка, т.к. в реальности умирают чаще те, у кого были разные хронические болезни, т.е. они и без ковида в среднем бы прожили меньше, чем в среднем по всему населению. Эта статья делает попытку это учесть:
https://wellcomeopenresearch.org/articles/5-75/v1
-- авторы сначала считают среднюю YLL без учета болезней по итальянским данным (получается 14 лет), а потом учитывают разные long-term conditions среди ковидных смертей, опять же по итальянским данным, и получают 13 лет, т.е. где-то на 10% меньше.

mi_b на это говорит, что это не учитывает самого главного: чуть ли не половина (!) ковидных смертей случаются в домах престарелых (США: см., Германия: см.), а средний срок дожития в доме престарелых составляет всего 1--2 года (!!) (1 год в США: см., 2 года в Германии: см.).

Т.е. если очень грубо ввести на это поправку, то 12 лет в США (среднее из трех оценок, приведенных выше) надо бы сначала уменьшить на 10%, получив где-то 11 лет, а потом посчитать среднее арифметическое с 1 годом дожития в nursing homes, получив в итоге 6 лет. Это уже существенно меньше. Процитированные выше работы этот фактор просто игнорируют.

С другой стороны -- если правда половина смертей в nursing homes, где масса народу и так за несколько месяцев умирает, то это должно было бы привести к видимой отрицательный избыточной смертности после окончания вспышки эпидемии, например, в Нью-Йорке. Но этого вообще не видно: красная линяя (2020) после вспышки просто идеально возращается к серым линиями предыдущих годов.


Наконец, можно сравнить этот показатель с гриппом. Вот статья, найденная mi_b, которая расчитывает YLL для гриппа по голландским данным для обычного сезонного гриппа (сезоны 1999--2008):
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0031197
Long-term conditions тут тоже не учитываются, но делается попытка посчитать реальное (а не "официальное") кол-во смертей от гриппа. Получается YLL=9 лет в среднем за все сезоны, что близко к ковиду. Но для сезона 2009, т.е. пандемии свиного гриппа, получается аж 30 лет! Свиной грипп был необычный: смертность от него была в среднем ниже, чем у обычного сезонного гриппа (IFR порядка 0.01%: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3809029/, т.е. в несколько раз ниже обычного гриппа), но чаще, чем обычно, умирали маленькие дети, отсюда сильно выше средний YLL. То есть IFR ковида где-то раз в 150 выше, чем у свиного гриппа 2009 года, но YLL может быть раз в 5 ниже.

Мой вывод: ничего по существу это не меняет, ковид очевидно все равно на полтора порядка опаснее гриппа, хоть свиного, хоть обычного.
profile

IFR

В комментариях к прошлой записи началось какое-то безумие, поэтому я решил их закрыть. Но польза от них была: в дискуссии с trueview я несколько изменил свое мнение об IFR ковида. Возьмем два больших серологических исследования в топовых журналах с большой случайной выборкой -- одно в НЙ, одно в Испании.

Exhibit 1: https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(20)31483-5/fulltext. На 11 мая антитела были у 5.0% процентов населения Испании. Это 2.35 млн человек. Подтвержденных смертей на тот момент было 27 тысяч (см.). Это дало бы IFR=1.15% (в самой статье этого числа нет, но мета-анализы вроде этого https://www.sciencedirect.com/science/article/pii/S1201971220321809 для этой работы как раз и получают 1.15%). Но избыточных смертей в Испании в 1.5 больше, чем подтвержденных ковидных (см.). То есть избыточных смертей было примерно 40 тыс., и поскольку ясно, что они почти все ковидные, то получается IFR=1.7%.

Update (Feb 5): Там делали два серологических теста, у обоих специфичность ~100%, поэтому можно брать объединение их результатов. Получается 6.3% сероположительных, это 3.0 млн. Но избыточных смертей весной на самом деле было 48 тыс. (я посчитал). Итого IFR=1.6%.

Exhibit 2: https://www.nature.com/articles/s41586-020-2912-6. К концу мая в НЙ было 20% населения с антителами. Остюда авторы статьи получают IFR=0.97%, исходя из кол-ва смертей от *подтвержденного* ковида (в частности, они исключают смерти от *предположительного* ковида!). На тот момент избыточная смертность в НЙ была в 1.5 раза выше, чем кол-во подтвержденных смертей (см.), т.е. реально можно предположить IFR=1.5%.

Понятно, что IFR сильно зависит от возраста (см. https://github.com/mbevand/covid19-age-stratified-ifr и ссылки там), поэтому интегральный IFR в каждой стране или городе зависит от местной возрастной пирамиды (скажем, в Латинской Америке интегральный IFR может быть раза в два ниже западноевропейского). Но для возрастной пирамиды похожей на Испанию/Нью-Йорк, я думаю, можно брать IFR=1.5% как разумную интегральную оценку.

Есть странные люди, которые по-прежнему повторяют про небольшое отличие от гриппа. Это смехотворно. По оценкам CDC, кол-во смертей от гриппа в США за сезон обычно находится в диапазоне 20--50 тыс. (https://www.cdc.gov/flu/about/burden/), а кол-во симптоматических инфекций за сезон -- 20--40 млн. С учетом того, что симптоматических инфекций, по оценкам, примерно треть от всех, это в среднем соответствует где-то IFR=0.05% для гриппа (https://github.com/mbevand/covid19-age-stratified-ifr). Здесь кол-во смертей -- это НЕ просто кол-во смертей с гриппом в death certificate, а довольно сложная оценка, полученная с учетом того, что многие смерти от гриппа могут быть записаны как смерти от пневмонии и т.д. (https://www.cdc.gov/flu/about/burden/how-cdc-estimates.htm). IFR=0.05% -- т.е. получается где-то (очень приблизительно) в 30 раз меньше, чем у ковида (отношение по возрастным группам см. тут: https://github.com/mbevand/covid19-age-stratified-ifr). Избыточная смертность в США на сегодня где-то тысяч 450 (см.), так что уже на порядок больше обычного кол-ва смертей от гриппа за сезон, а эпидемия ковида там еще в самом разгаре.

Как и обещал, за голословные утверждения о том, что ковид не опаснее или лишь немного опаснее гриппа, я теперь буду сходу банить (не голословные -- т.е. когда они сопровождены подробным обоснованием и объяснением, почему всё написанное выше неверно, -- допускаются).
profile

с наступившим

В ночь на 1ое января от ковид19 умер в больнице отец (лет 60) моего одноклассника и друга с первого класса. По этому поводу я немного изменю политику модерации комментариев в постах с коронавирусной статистикой. Каждый, кто или напишет что-нибудь идиотское об "обычном гриппе" / "слегка опаснее обычной ОРВИ" (не идиотское можно), или что угодно с фразеологией вроде "психопандемия" / "лево-либеральная хунта" / и т.п., сразу отправится в бан со ссылкой на эту запись. Спасибо за внимание.

Все мои коронавирусные графики по России и миру теперь можно найти тут: https://github.com/dkobak/excess-mortality/, они там обновляются более регулярно, чем здесь в жж. Ссылки, если нужно, лучше ставить туда. Jupyter notebook, который показывает избыточную смертность по всем странам, можно запустить прямо в браузере.

С наступившим.

Update: Комментарии закрыл.
profile

смертность за ноябрь

Внезапно с опережением графика появились ноябрьские данные от Росстата (картинки увеличиваются по клику).



Избыточная смертность с апреля по ноябрь -- 264 тыс. Число смертей, которые ежедневно рапортует оперативный штаб, за тот же период составило всего 40 тыс., так что в 6.5 раз меньше. По данным Росстата, за тот же период произошло 59 тыс. смертей от подтвержденного коронавируса, и 116 тыс. (включая уже упомянутые 59 тыс.) были связаны с коронавирусом.

В разных регионах все это выглядит очень по-разному. В Башкортостане, например, избыточная смертность в 115 раз выше кол-ва смертей по данным оперативного штаба:



На анимации хорошо видно распространение вируса по стране:



Ну и наконец сравнение с другими странами (оценки избыточной смертности тут взяты из Economist и NYT). "Коэффициент занижения" 6.5 (отношение избыточной смертности к оперативным данным -- тем, которые обновляются ежедневно) -- с большим отрывом самый большой из всех стран, по которым есть данные об избыточной смертности. **В предположении**, что этот коэффициент останется таким же, избыточная смертность в России **на сегодня** составила ~360 тыс., т.е. на втором месте после США, где уже ~450 тыс. Per capita в РФ это 0.25%, примерно как в Мексике/Перу/Эквадоре/Боливии.



Впрочем, нужно помнить, что в Перу/Эквадоре/Боливии население гораздо моложе, чем в РФ, поэтому избыточная смертность в процентах от обычной годовой смертности там гораздо выше: https://kobak.livejournal.com/117436.html.

Update (Dec 30): Данные, код и все картинки теперь на https://github.com/dkobak/excess-mortality.