UA / RU
Підтримати ZN.ua

Імовірних жертв пандемії в Україні втричі більше, ніж за даними МОЗ

Математики проаналізували статистичні дані про захворюваність на ковід

Автори: Ігор Іванов, Ігор Бровченко

Для повнішої оцінки кількості жертв пандемії у світі використовується поняття «надлишкова смертність» — збільшення кількості смертей з усіх причин, порівняно зі звичайним рівнем.

Виявляється, що в тих регіонах України, в яких багато людей померло від коронавірусу, спостерігалась і надлишкова смертність, що десь утричі перевищувала кількість зафіксованих смертей від вірусу SARS-CoV-2. Збільшення втричі виявилося приблизно однаковим у регіонах, і воно спостерігалося впродовж усього часу пандемії в Україні, починаючи з березня.

Світова практика оцінки поширення епідемії COVID-19 включає не лише дослідження епідемічної статистики, а й статистику смертності з усіх причин. З самого початку пандемії у багатьох країнах спостерігалося явище надлишкової смертності — перевищення кількості смертей з усіх причин (називатимемо його «загальною смертністю») над типовою загальною смертністю за ті самі періоди часу. За «типову смертність» часто беруть середнє значення за певний період: наприклад, за останні п’ять років, як це зроблено в нашому дослідженні. Трохи тонший можливий підхід — оцінити тенденції у зміні смертності з усіх причин і визначити, якою вона мала б бути поточного року.

У країнах світу, котрі найбільше постраждали від пандемії, загальна смертність в окремі тижні зростала приблизно вдвічі — наприклад, у Бельгії, Великій Британії, Італії, Іспанії та Польщі. В інших країнах зростання загальної смертності було значно меншим чи його не було взагалі.

У загальнонаціональній статистиці України до останнього часу істотної надлишкової смертності, яка б могла бути однозначно пов’язана з COVID-19, не спостерігалося геть. Щомісячні дані Держстату показували стійке зменшення кількості смертей, яке було частиною багатолітнього низхідного тренду: на нього впливали також аномалії щодо кількості смертей в областях, котрі зазнали часткової окупації, — Донецькій та Луганській. Складалося поверхове враження, буцім статистика МОЗ про поширення вірусу — це одне, а демографічна статистика Держстату — щось геть інше, бо впродовж першого півріччя 2020 року смертність в Україні була найнижчою за останні п’ять років.

Ситуація різко змінилася, коли щоденні дані Міністерства юстиції про загальну смертність, доступні на сайті «Економіка карантину», показали понад 2000 смертей для окремих дат третьої декади жовтня (див. рис. 1, доступний у «Прогнозі РГ-27»). Зростання загальної смертності, як видно з рис. 1, почалося ще з вересня, що також підтвердив Держстат у вересневих даних про загальну смертність, які вийшли 21 листопада. Осіб, котрі померли у вересні з усіх причин, виявилось аномально багато: на 14% більше, ніж цього самого місяця в середньому за п’ять років (див. рис. 2, взятий з «Прогнозу РГ-29»).

Рис. 1. Смертність з усіх причин, за даними Міністерства юстиції, станом на 5 листопада (такі дані були доступні на сайті «Економіка карантину»: https://q.rating.zone/)

Рис. 2. Смертність за 9 місяців у 2020 році та смертність за роками у 2015–2019 роках, з вирахуванням середньої смертності у 2015–2019 роках, і кількість летальних випадків від COVID-19 — зі щоденної статистики (за датою їх настання)

Стало цікаво — а що ж діється в регіонах, які напевно уражені по-різному? І справді: виявилося, що візуально надлишкова смертність була зафіксована саме в регіонах із великою кількістю смертей від коронавірусу, причому не лише у вересні (рис. 3, взятий із «Прогнозу РГ-29»).

Рис. 3. Оцінка надлишкової смертності в регіонах за місяцями 2020 року, порівняно з середнім показником за 2015–2019 роки (дані ДССУ)

Виникла ідея кількісно порівняти ці показники смертності. Також було знайдено відношення виявленої смертності від COVID-19 до надлишкової смертності у випадках, коли вони обидві додатні. Отриману величину названо «часткою виявлення надлишкової смертності». Результати представлено у таблиці на рис. 4 (взятий із «Прогнозу РГ-29»).

Рис. 4. Надлишкова смертність і смертність від COVID-19 у вересні та їх відношення

На рис. 4 регіони впорядковано за спаданням абсолютної надлишкової смертності. Крім того, що в регіонах із високою надлишковою смертністю було багато покійників із підтвердженим діагнозом COVID-19, «частка виявлення надлишкової смертності» там змінювалася досить слабко. На рис. 5 показано гістограму числа регіонів за «часткою виявлення надлишкової смертності», і переважна більшість їх концентрується в діапазоні 25–30% або довкола нього. Помітні винятки становлять Луганська та Донецька області, що давно демонструють аномальну демографічну поведінку, а також Полтавська область, де у вересні був лише 21 летальний випадок.

Рис. 5. Розподіл регіональних значень «частки виявлення надлишкової смертності» (вересень)

Коректніше про те, скільки в середньому одиниць надлишкової смертності припадає на одну підтверджену смерть від коронавірусу, говорить так звана діаграма розсіювання (рис. 6, взятий з «Прогнозу РГ-30»), точки на якій відповідають парам значень у кожному регіоні, відповідно, смертності від вірусу (горизонтальна вісь) та надлишкової смертності (вертикальна вісь). Регресійна пряма, побудована на рис. 6, — це пряма, що найменше відхиляється від заданих точок за величиною надлишкової смертності. Середня кількість додаткових смертей, що припадає на одну підтверджену смерть від вірусу, задається її нахилом. У вересні він становив 3,07, при коефіцієнті кореляції R=0,89, значущість якого (ймовірність того, що це збіг випадкових обставин) виявилася надзвичайно низькою: p10-6.

Рис. 6. Діаграма розсіювання показників смертності у вересні

Постало запитання: а що ж було в інші місяці? Виявилося, що приблизно те саме. В усі місяці пандемії в Україні регресійна пряма показувала нахил у бік збільшення загальної смертності в тих регіонах, у яких було багато покійників із підтвердженим COVID-19, ще й із дедалі більшим коефіцієнтом (див., наприклад, рис. 7 для серпня; рисунки для решти місяців є у «Прогнозі РГ-30»). Змінювався лише очікуваний рівень смертності при нульовому значенні смертей від вірусу («базова смертність»), що був загалом нижчий, ніж середнє значення за п’ять попередніх років. Його коливання можуть бути пов’язані з особливостями ведення статистики Держстатом та з іншими чинниками, які впливають на смертність з усіх причин (зокрема Держстат навесні повідомляв про проблеми з отриманням даних у зв’язку з карантинними обмеженнями, і найбільші відхилення оціненої базової смертності від середньої за п’ять попередніх років теж припадають на весну).

Рис. 7. Діаграма розсіювання показників смертності в серпні

Для кожного місяця епідемічної статистики коефіцієнт нахилу регресійної прямої вказав на наявність більшої смертності від вірусу, ніж про це відомо з даних МОЗ. Але він мав і певну динаміку (див. рис. 8 та 9, що також доступні у «Прогнозі РГ-30»): у березні був порядку 10, у квітні–червні близько 2, а в липні–вересні — від 3 до 3,5. І така динаміка досить природна, бо в березні виявлення хворих перебувало на дуже низькому рівні, у квітні–червні робилася ставка на масове тестування, але згодом темпи поширення хвороби стали вищими за темпи розширення тестування, і частка виявлених випадків знову знизилась.

Подивімось уважніше на зведені результати, що на рис. 8 та 9. Стандартна помилка говорить, як сильно може типово відхилятися справжнє значення нахилу прямої від знайденого. Вільний член задає відхилення загальної смертності у 2020 році, порівняно з середньою у 2015–2019 роках, за відсутності зареєстрованих смертей від коронавірусу («базової смертності»). R — коефіцієнт кореляції — міра лінійної залежності між даними (значення, близькі до 1, говорять про ідеальну лінійну залежність). Цікаво, що значущість p для всіх місяців досить низька, а для останніх трьох — і взагалі менша від однієї мільйонної частки. Це означає, що менше одного шансу на мільйон, що кількість смертей від вірусу не впливає на загальну смертність у регіонах. Для березня результати найменш достовірні.

Рис. 8. Таблиця результатів регресії для двох типів регіональної смертності: надлишкової та підтверджених летальних випадків від COVID-19

Рис. 9. Результати регресії для двох типів відносної смертності. Динаміка нахилу регресійної прямої та стандартної помилки для неї (табличні дані див. на рис. 8)

Статистика розвинених країн свідчить, що за належного діагностування вдається ідентифікувати практично всю надлишкову смертність як смертність, спричинену новим коронавірусом (наприклад, у США, Франції, Великій Британії, Бельгії, Швеції та Швейцарії), тоді як у менш розвинених країнах, а тим більше в авторитарних, котрі навмисне прикрашають статистику, кількість смертей від вірусу зазвичай поступається надлишковій смертності в декілька разів (2,5 разу у Мексиці, три рази в Польщі, 7 разів у Росії тощо).

Якщо підсумувати, можна впевнено стверджувати, що насправді смертей, пов’язаних із COVID-19, приблизно втричі більше, ніж свідчать щоденні дані МОЗ. Судячи з його даних, на середину грудня їх близько 50 тис. і щодня стає більше приблизно на 500 (див. рис. 10, взятий з «Прогнозу РГ-32»).

Рис. 10. Динаміка смертності з усіх причин з декількома тижневими приростами (дані Мін’юсту, доступні на сайті «Економіка карантину»: https://q.rating.zone/)

Дослідження проведено за підтримки ЮНІСЕФ, дитячого фонду ООН. Щоденні дані про загальну смертність надано ресурсом «Економіка карантину».