profile

избыточная смертность в праздники

Алексей Ракша прислал ссылку на статью "Избыточная смертность в России в праздничные дни" (2021) (https://demreview.hse.ru/article/view/12392) А. Немцова с соавторами. Авторы анализируют полученное ими из Росстата число смертей в Росcии с 2000 по 2017 *по дням*. В данных ясно видны пики смертности на крупные праздники; в среднем порядка 6 тысяч избыточных смертей на Новый год, 0.8 тыс. на 8 марта, и по 0.5 тыс. на 23 февраля, 1 мая, и 9 мая (1 мая точно оценить труднее из-за неясных артефактов 1 числа каждого месяца). Полюбуйтесь на Рисунок 1:



Но еще больше меня впечатлил Рисунок 9. Авторы получили микроданные, в которых указан день рождения для каждой смерти с 2011 по 2017, и посчитали суммарное кол-во смертей за или через X дней от дня рождения. Выглядит это так (здесь ноль по горизонтали -- это день рождения):



Гигантский всплеск, порядка 8 тысяч избыточных смертей в год, приходится на дни рождения! Причем избыточная смертность продолжается в течение чуть ли не трех недель после дня рождения. Это выглядит довольно странно; авторы тоже, в общем, разводят руками.

К сожалению, динамика по годам, а также половозрастная структура этих смертей в статье почти не проанализирована.

PS. Серая линия на Рисунке 1 выглядит так, словно смертность повышается в середине каждого месяца (?). Авторы это не комментируют.

PPS. Александру Немцову, между прочим, 88 лет: https://ru.wikipedia.org/wiki/Немцов,_Александр_Викентьевич. Несколько месяцев назад я ему написал письмо с коротким вопросом, это было в субботу вечером. Он мне тут же ответил, обстоятельно и по делу. Всем желаю такой же бодрости. Заметка на его 85-летний юбилей: https://psychiatr.ru/files/magazines/2018_09_scp_1390.pdf. Краткое выступление: https://www.youtube.com/watch?v=HuNud226JyI.
profile

загадка октябрьского всплеска

К прошлой записи про понедельную смертность https://kobak.livejournal.com/123232.html уже 350+ комментариев. В процессе разговора выяснилось (спасибо in_kant), что на mortality.org лежат данные по смертности в России с разбивкой аж на 5-летние возрастные группы. Вот как выглядит среднее с 2000 по 2019 в каждой группе:



Это огромная картинка, по ссылке открывается в полный размер. Обратите внимание, что у детей смертность выше летом (почему? по всей видимости, потому что они купаются и тонут :-/ см. статью об этом по венгерским данным: https://www.tandfonline.com/doi/full/10.1080/14767058.2019.1594765), а у пожилых -- зимой (видимо, из-за респираторных инфекций и осложнений). Где-то посередине есть возраст, в котором сезонность исчезает. У женщин это где-то 35-40, у мужчин -- где-то 45-50.

В прошлой записи мы обсуждали парадокс самой младшей группы, где смертность как будто убывает в течение года. Тут видно, что это происходит только в группе 0-5 лет, т.е., по всей видимости, речь о младенческой смертности. Эффект по-прежнему довольно загадочный.

Но меня больше интересует другой загадочный эффект: октябрьский всплеск смертности, который появляется у пожилых. Я спросил у трех демографов -- никто не знает (и раньше не замечал). Чтобы попробовать разобраться, можно посмотреть на данные по регионам; к сожалению, недельных данных по регионам нет, но есть месячные. Тут еще одна важная новость: Алексей Ракша прислал мне окончательные данные Росстата по дате смерти с 1990 по 2020 ("оперативные" данные Росстата, которыми все пользуются, сгруппированы по дате регистрации, а не по дате смерти). Я их выложил у себя на гитхаб (https://github.com/dkobak/excess-mortality/tree/main/russian-data). Вот как выглядит среднее число смертей в день (т.е. я делю на кол-во дней в месяце) по регионам, среднее за 2011--2019:



Видно, что октярьская смертность выше ноябрьской почти везде. Красным отмечены регионы, где *сентябрьская* смертность тоже выше ноябрьской. Видно, что это северные регионы. В комментариях прозвучала красивая гипотеза (а_konst), что весь этот сентябрьско-октябрьский всплеск связан с отоплением: в ноябре уже везде топят, поэтому смертность уменьшается, а в сентябре-октябре еще не везде, и пожилые умирают из-за низкой температуры в квартире. Но вообще-то отопление вроде как включают уже в сентябре, особенно на севере, так что вроде бы не сходится. С другой стороны, если это осложнения от пневмоний, то там несколько недель еще проходит, наверное.

Есть какие-то соображения на этот счет?
profile

смерти в россии по неделям

Я построил график смертей в России по неделям (с 2000 по конец 2020, данные с http://mortality.org), с разбивкой на пол и возраст, и теперь не могу перестать на него смотреть! Советую открыть в полный размер.



Ежегодные пики смертности у мужчин возраста 15-64 в первую неделю года -- это не фальсификации данных, а водка на Новый год. Каждый год выкашивает две-три тысячи человек. У мужчин 65-74 и женщин 15-64 этот эффект тоже виден, но гораздо слабее. По сравнению с началом 2000-х, в последние годы ситуация с этим немного получше.

Очень хорошо видна августовская жара 2010 года.

Разумеется, видны две волны ковида: весны и зимы 2020 года.

В группе женщин 75-84 лучше всего видны сезонные колебания -- зимой смертей больше из-за гриппа и других респираторных инфекций и их последствий. В некоторые зимы этот всплеск больше, в некоторые меньше.

Несколько вещей бросаются в глаза, но объяснить я их не могу:

  1. Что за пик у мужчин 15-64 (и поменьше в других группах) летом 2001?
  2. Почему новогодние пики иногда длиной не одну неделю, а несколько недель? Например, в 2006.
  3. Почему новогодний пик 2013 такой высокий, и виден во всех возрастных группах? Даже у старушек 85+?
  4. Почему у мальчиков до 14 лет смертность заметно выше летом? Особенно в начале 2000-х это хорошо видно.


Update: Добавляю несколько графиков под кат. Collapse )
profile

итоговые результаты выборов 2021

В продолжение предыдущей записи. Сергей Шпилькин выложил окончательные данные с последних выборов, полученные с помощью деобфускатора Александра Шпилькина: https://purl.org/cikrf/un/unfuck.py.html (на Хабре умельцы параллельно написали еще несколько деобфускаторов, см. https://habr.com/ru/news/t/578832 и по ссылкам).

Мой любимый график:



Больше графиков в моем треде в твиттере: https://twitter.com/hippopedoid/status/1443594383106904065 (по-английски). Все данные можно скачать тут https://github.com/dkobak/elections, код анализа и графики выложены здесь https://github.com/dkobak/elections/tree/master/analysis/duma2021. Спасибо oude_rus и podmoskovnik за обсуждения.

Отдельно отмечу график со сравнением результатов электронного и физического голосования по всем регионам, где проводилось электронное голосование.
profile

цик зашифровала результаты

Неясно, когда мы сможем полюбоваться на пики на целых процентах в результатах думских выборов, т.к. ЦИК мало того что поставила на сайт капчу (что затрудняет автоматическое скачивание результатов), но и зашифровала результаты!

Вот, например, избирательный участок во Владивостоке. Таблица результатов прекрасно видна в браузере; первое число в таблице (число избирателей в списках) -- 1650. Но в html коде не написано "1650", а написано так:

<span class="ksy_hjd">ш</span><b><span class="xeo_qey"><span class="wlr_qob"></span></span><span class="sdk_zob">я</span><span class="kfd_jdh">6</span><span><span class="gry_oxi"></span></span><span class="ocx_nxq">5</span><span style="z-index: normal;">0<span style="display: none;"></span></span>

-- 6, 5 и 0 тут еще можно разглядеть, а ведущая 1 появляется из стиля

.bmiv_shgq .xeo_qey::after {
content: '1';
}

Всё это генерится случайным образом при каждом обновлении страницы. Более того, используются несколько видов шифрования, один из которых -- это подгружение случайно сгенерированного шрифта, в котором буквы выглядят как цифры. Как это можно распарсить (особенно с подмененным шрифтом), не очень понятно.

Обсуждение у Сергея Шпилькина в фейсбуке: https://m.facebook.com/sergey.shpilkin/posts/4392964697458799

Update. Сергей прислал данные. Графики: https://kobak.livejournal.com/122643.html?thread=2993939#t2993939
profile

дельта в россии

Сегодня Росстат выложил данные за июнь, а Голикова на пресс-конференции назвала предварительное число смертей по стране за июль.

Collapse )
profile

избыточная смертность в elife

Сегодня в eLife окончательно вышла наша статья: Tracking excess mortality across countries during the COVID-19 pandemic with the World Mortality Dataset (https://elifesciences.org/articles/69336). Опубликованные данные относятся к началу июля, так что уже несколько устарели. Свежие графики, как обычно, доступны тут: https://github.com/dkobak/excess-mortality.

Заодно -- вчера увидел такой препринт: COVID-19 pandemic in Saint Petersburg, Russia: combining surveillance and population-based serological study data in May, 2020 - April, 2021 (https://www.medrxiv.org/content/10.1101/2021.07.31.21261428v1). Если не ошибаюсь, это первое большое серологическое исследование из России. Результаты: серопревалентность на март 2021 года составляла 45%. IFR, посчитанный исходя из избыточной смертности, получился 0.9%.
profile

Neighbour embeddings for scientific visualization

Запись моего доклада (как бы в Гейдельберге, но, увы, через Zoom) о том, что такое neighbour embeddings, как они работают, кому и почему это вообще интересно, и чем одни алгоритмы *на самом деле* отличаются от других алгоритмов: https://www.youtube.com/watch?v=CsUqmug7ZMc&t=315s.

А вот как, кстати, перевести "neighbour embedding"? Я сейчас специально поискал в текстах о t-SNE на русском языке, но никакого разумного перевода не увидел. Вложение соседей? Трудность в том, что "neighbour" тут не дополнение, а существительное в роли прилагательного. Соседское вложение?
profile

2020 по причинам смерти

Оказывается, Росстат уже неделю назад выложил окончательные данные за 2020 по причинам смерти!

Сегодняшняя статья в Медиазоне: https://zona.media/article/2021/06/18/pneumonia
Данные: https://rosstat.gov.ru/folder/11110/document/13269

По-быстрому сделал сравнение с 2019, отсортированное по возрастанию %:



Тут много интересного. Понятно, что почти весь рост наверху таблицы -- это на самом деле ковид (если надо объяснять, то не надо объяснять) (уточнение: избыточных тысяч 10--20 может быть от жары на Урале). Алкогольные смерти выросли на 6% (на 3 тысячи). Самоубийства, убийства, ДТП -- все уменьшилось.

PS. Это сравнение с 2019, без учета трендов. Например, смерти от инфекционных не-респираторных заболеваний (а это в основном ВИЧ и туберкулез) тоже упали, но это, наверное, вообще не связано с пандемией и может ложиться на тренд (не проверял).
profile

хиатус 2

А интересно, все те люди, которые годами говорили, что потепление остановилось в 1998, -- они уже переключились и начали говорить, что потепление остановилось в 2016, или еще нет?


https://data.giss.nasa.gov/gistemp/graphs_v4

Предыдущий пост на эту тему: https://kobak.livejournal.com/110387.html (2017), там ссылки на обсуждения у Аввы в 2013.