В данных о смертности много пробелов. Исследователи научились заполнять их с помощью моделей — в том числе для России

Рассказываем, как это работает, на примере «Глобального бремени болезней» — одного из самых известных медицинских исследований
В России очень высокий уровень смертности от панкреатита, кардиомиопатии и болезней, связанных с чрезмерным употреблением алкоголя. А от хронической болезни почек россияне умирают практически реже всех в мире. Это данные «Глобального бремени болезней» — одного из самых известных и авторитетных исследовательских проектов в мире. Исследование решает непростую задачу — сделать статистику о заболеваемости и смертности по странам доступной и сопоставимой. Данными пользуется в том числе Всемирная организация здравоохранения, а на последний отчет сослались в 164 тысячах исследований. Рассказываем, что можно узнать из «Глобального бремени болезней о России».
> > > >

В начале 1990-х аналитики Всемирного банка готовили отчет о положении дел в здравоохранении и попросили Всемирную организацию здравоохранения ответить для него на два вопроса — от каких причин умирает больше всего людей в мире и что чаще всего приводит к проблемам со здоровьем? Оказалось, что ВОЗ не может дать ответ: надежных, консистентных и сопоставимых между собой данных о заболеваемости и смертности по всем странам мира тогда просто не существовало. 

Сейчас мы знаем, что больше всего жизней уносят заболевания системы кровообращения (около 19 млн смертей в мире каждый год). Самая высокая смертность от них — в странах Восточной Европы, включая Россию. Также известно, что эта группа заболеваний вносит самый большой вклад в преждевременную смертность. 

Данные о заболеваемости и смертности по странам мира собирает, обрабатывает и выкладывает в открытый доступ Институт измерения показателей и оценки здоровья (IHME), который проводит одно из самых авторитетных в мире медицинских исследований — «Глобальное бремя болезней». Оно проводится с 1991 года, последний отчет с данными на 2021 год вышел в 2024-м. Сейчас на сайте исследования доступны данные по 371 заболеванию и травме для 204 стран и территорий.

Почему собрать данные о заболеваемости и смертности так сложно

Сравнить разные страны по заболеваемости и смертности — не такая простая задача, как может показаться. Большинство стран используют для диагностики заболеваний и установления причины смерти Международную классификацию болезней (МКБ). Но это не всегда автоматически делает данные сопоставимыми. 

В некоторых странах регистрируют не все смерти: например, в Монголии и Китае смертей их может быть на 25% больше официально зарегистрированных. А из зарегистрированных смертей значительная доля может быть без указания причины: в Казахстане причина не указана для 13% смертей, в Китае — для 38%. В развивающихся странах регистрация рождения и смерти — это ответственность родственников, и часто долгая и сложная процедура. Процесс может усложняться нехваткой медиков, которые могли бы заполнить свидетельство о смерти, и в целом плохо работающей государственной системой регистрации.

В России в статистику попадают все смерти и практически для всех указана причина. Но очень часто эта причина — «мусорная». В МКБ есть целый блок таких причин — «неуточненных», «с неопределенными намерениями». Их используют, когда установить причину смерти не получилось. Частое использование таких причин делает статистику ненадежной и плохо сопоставимой с другими странами. В России доля смертей от «неопределенных» повреждений самая высокая в Европе. 

Кроме того, в разных государствах разная половозрастная структура населения. Если сравнивать данные, не учитывая этого, можно прийти к неправильным выводам: смертность от онкологии может быть выше в одной стране, чем в другой, потому что там больше пожилых, а не из-за худшего качества медицины. Подробнее о том, зачем учитывать возрастную структуру населения, мы рассказывали в другом материале

Из чего складываются оценки «Глобального бремени болезней»

Показатели, связанные со здоровьем, почти никогда не публикуются в чистом виде, в их основе всегда лежит какая-то модель, объясняет эпидемиолог Антон Барчук. «Модель может быть элементарной, когда просто агрегируются данные, или довольно сложной, когда используется несколько переменных для создания показателя. Например, если взять заболеваемость на 100 тысяч населения – это одна модель. Стандартизация по возрасту – другая, уже более сложная. Мы можем разделить мужчин и женщин, основываясь на предположении, что показатели для них разных – это уже стратификация», – рассказывает эксперт.

Институт измерения и оценки показателей здоровья (IHME), который руководит исследованием «Глобальное бремя болезней», использует официальные государственные данные о смертности и заболеваемости. Чтобы верифицировать и заполнить пробелы в этих данных, их дополняют другими источниками. Для каждой страны таких дополнительных источников около 1500 — это переписи, опросы населения, данные медицинских организаций, результаты вербального вскрытия (интервью родственников умершего для определения причины смерти). 

Для каждой страны и каждого заболевания, фактора риска или причины смерти есть отдельный набор источников и способ оценки.

Как пользоваться данными «Глобального бремени болезней»

На сайте IHME есть конструктор данных «Глобального бремени болезней». В фильтрах можно выбрать единицы измерения, заболевания и травмы, год, пол, страну. К конструктору есть подробная инструкция по использованию. Все данные также доступны для скачивания, но для этого нужно зарегистрироваться на сайте (это можно сделать с любой почты, скачивание бесплатно, ссылка придет на указанную при регистрации почту).

Список источников по каждой стране собран на отдельной странице.

Методология оценки для каждого заболевания или причины смерти также доступны в специальном разделе сайта. Кроме описания процедуры сбора и обработки данных (разной для разных болезней), там есть описание модели, которая использовалась для оценки, и список использованных в ней переменных.

Список кодов Международной классификации болезней 9-го и 10-го пересмотра, которые авторы «Глобального бремени болезней» относят к каждой категории заболеваний, можно найти в приложении к публикации в журнале Lancet (Supplementary appendix 1, Table S5: List of International Classification of Diseases (ICD) codes mapped to the Global Burden of Disease cause list for causes of death).

Для каждой страны и каждого заболевания, фактора риска или причины смерти есть отдельный набор источников и способ оценки. Разберемся, как это устроено, на примере смертей от наркотиков в России. По официальным данным, от психических расстройств, связанных с употреблением наркотиков, в 2021 году умерло 2419 человек. Оценка «Глобального бремени болезней» значительно выше — 6557 человек. Исходные данные для этих оценок берутся в Российской базе данных о рождаемости и смертности, которая, в свою очередь, основана на данных Росстата. 

В официальные данные могут попадать не все смерти от наркотиков — в свидетельстве о смерти могут неточно записать причину, случайно или специально (например, по просьбе родственников или чтобы занизить статистику смертности от наркотиков в регионе).

Чтобы уточнить официальную оценку, используют статистическое моделирование: в случае с наркотиками исследователи берут для этого данные о распространенности инъекционных и опиоидных наркотиков, распространенности курения, валовом региональном продукте (ВРП) на душу населения, доступности здравоохранения, уровне образования. Все они в разной степени связаны с уровнем смертности от наркотиков. Подробно методология оценки описана в публикации в журнале Lancet.

По данным IHME, больше всего смертей от психических расстройств, связанных с наркотиками, вызвано употреблением опиоидов — 4886 случаев. 408 человек умерли от амфетаминов, 242 — от кокаина, 1022 — от других наркотиков. Такой разбивки по типам веществ нет в официальных данных — это тоже результаты моделирования.

«Исследования говорят, что наша структура потребления не такая уж оригинальная. Мы в этом смысле не сильно отличаемся от других стран. И, соответственно, есть возможность, используя данные научных публикаций, сделать расчеты о том, какая часть смертей приходится на какие конкретные наркотики», — говорит профессор ВШЭ, один из авторов исследования «Глобальное бремя болезней» Василий Власов.

Что можно узнать из данных IHME по России

В российской официальной статистике можно найти довольно полные по причинам смерти в разбивке по полу и возрасту. Использовать «Глобальное бремя болезней» можно, например, когда нужно сделать межстрановые сравнения. Из них можно узнать, что Россия — лидер среди всех стран по смертности от панкреатита и сосудистых болезней кишечника. А уровень смертности от эпилепсии и хронической болезни почек — один из самых низких в мире. 

Кроме того, авторы исследования оценивают не только заболеваемость и смертность. Они рассчитывают и другие показатели: например, число потерянных лет жизни. Эта метрика отражает, сколько лет жизни было утрачено в результате преждевременной смертности от той или иной причины. Она позволяет оценить, какие заболевания и травмы оказывают наибольшее влияние на общественное здоровье.

В России наибольший вклад в преждевременную смертность вносит ишемическая болезнь сердца — в 2021 году 4 017 лет в пересчете на 100 тысяч населения (не считая коронавируса, который в 2021 году вышел на первое место со значением 4 921 на 100 тысяч).

Помимо других сердечно-сосудистых заболеваний (инсульт, кардиомиопатия) в пятерку причин, которые отнимают у россиян больше всего лет жизни, входит селфхарм (самоубийство или последствия попытки самоубийства). Значение в 2021 году составило 926 на 100 тысяч. Причем у мужчин значение выше, чем у женщин. В среднем в мире селфхарм не входит даже в десятку причин, сильнее всего сокращающих жизнь, а в странах с высоким доходом — на четвертом месте, но значения показателя в два раза ниже российских.

Другой расчетный показатель — подверженность факторам риска. Исследователи проанализировали то, как различные факторы риска (в списке их 88) влияют на здоровье. Для россиян самый значительный фактор риска — курение (с ним связано 8% смертей). На втором месте — диета с низким содержанием цельнозерновых (3,8% смертей). Она ассоциирована с раком толстой и прямой кишки, ишемической болезнью сердца, сахарным диабетом. На третьем — загрязнение воздуха твердыми частицами (3,7%).

В европейском регионе, к которому ВОЗ относит и Россию, такие же самые распространенные факторы риска (но загрязнение воздуха на втором месте, а диета с низким содержанием цельнозерновых — на третьем). А вот в среднем в мире топ немного другой: больше всего смертей ассоциировано с загрязнением твердыми частицами (11,6%), следом идут курение (8,7%) и недоношенность и недостаточный вес при рождении (3,1%).

Какие у оценок IHME есть ограничения

Данные, собранные IHME, используют ВОЗ и Всемирный банк. А последний отчет «Глобального бремени болезней» упомянут в научных работах более 164 тысяч раз.

Однако надежность оценок «Глобального бремени болезней» очень сильно зависит от качества исходных данных. «В России неплохая государственная статистика. Но есть страны, где совсем нет данных по причинам смерти, например. В большинстве стран Африки, в Юго-Восточной Азии, в Китае, Индии государственная статистика собирается плохо», — объясняет Василий Власов. 

Даже надежные данные о таком базовом показателе, как численность населения, есть далеко не везде. В Афганистане, например, последняя перепись населения проводилась в 1979 году, в Конго — в 1984, в Узбекистане — в 1989. В России последняя перепись проходила в 2021 году, но ее качество вызывает вопросы (подробнее об этом мы рассказывали в другом материале). 

Когда статистика в стране совсем некачественная, исследователи могут использовать данные похожих государств. Например, если данных по онкологическим заболеваниям в Северной Корее нет, показатели будут взяты из соседних стран – Китая или Южной Кореи – и экстраполированы на отсутствующий в данных регион, объясняет Антон Барчук. Однако такие оценки гораздо менее надежны, чем основанные на достаточно полной государственной статистике, признает глава IHME Кристофер Мюррей. 

Но и в тех случаях, когда в стране достаточно полная статистика, данные IHME могут расходиться с официальными. Например, IHME оценивает число смертей от болезней системы кровообращения в 2019 году в 947 тысяч, а Росстат — в 841 тысячу. 

У расхождений может быть несколько объяснений. В частности, IHME перераспределяет «мусорные» причины (такие, которые указывают, когда точный диагноз поставить не удалось) по другим категориям. Поэтому, например, к сердечно-сосудистым заболеваниям в «Глобальном бремени болезней» отнесены «сердечные шумы и другие сердечные звуки» и «боль в горле и в груди», а в статистике Росстата — нет. 

Кроме того, данные IHME — это оценка. Для «Глобального бремени болезней» данные государственной статистики корректируются с помощью статистических моделей. В тех случаях, когда система регистрации смертей работает хорошо, а сравнивать данные с другими странами не нужно, имеет смысл использовать официальную статистику.

Использование статистических моделей может создать ложное впечатление «изобилия» информации в ситуации, когда на самом деле эмпирических данных очень мало, считают авторы публикации «Мониторинг прогресса и достижений стран с помощью глобальных прогнозов: хвост виляет собакой?». В результате эксперты в области здравоохранения, политики и исследователи часто делают выводы на оценочных данных, которые могут сильно отличаться от реальности. Например, многие государства отчитываются о достижении целей устойчивого развития, пользуясь оценочными данными — хотя как именно обстоит дело в реальности, никто не знает.   

В оценочных данных не всегда учтены все нюансы. «Например, по раку предстательной железы, которым болеют пожилые мужчины, модель в одном из исследований показала рост заболеваемости и у молодых мужчин. Это не совсем соответствует действительности. Молодые мужчины младше 35 практически не болеют раком предстательной железы. Это пример, когда модель основанная на данных о пожилых была использована, что сделать вывод о динамике у молодых вместо того, чтобы использовать реальные данные. Это узкий случай, но в других областях могут быть аналогичные проблемы», – объясняет Барчук.

Кроме того, оценки могут устаревать, и это редко учитывают при их использовании. Например, исследователи сравнили данные обследований домохозяйств о материнской и детской смертности по десяти странам за 2015 год с прогнозами ООН и IHME, сделанными для того же 2015 года. Медианные результаты обследований по детской смертности отличались на 15% от прогнозов ООН и на 19% — от прогнозов IHME. Для материнской смертности различие составило 55%. 

«Это не значит, что оценочными данными нельзя пользоваться. Но если речь идет об оценке, основанной на очень плохих исходных данных, интерпретировать ее стоит очень осторожно», —  заключают авторы исследования.

Авторы: Майя Гусева, Анастасия Кокоурова

Инфографика: Татьяна Цвирова, Кристина Гоникер

Материал был полезен?

«Если быть точным» — это данные с человеческим лицом.
Поддержите нас, чтобы мы могли и дальше помогать решать социальные проблемы.
Мы всегда рады вашим письмам
Присылайте ваши вопросы, отклики и предложения в телеграм-бот @tochnost_bot
Наши соцсети