76 наборов данных органы власти удалили со своих сайтов с начала года

С февраля 2022 года российские власти регулярно удаляют статистику из публичного доступа. По нашим подсчетам, в этом году удалили как минимум 76 наборов данных, а всего за 2,5 года из разделов «открытые данные» ведомственных сайтов пропало почти 600 датасетов. Теперь изучать страну журналистам и исследователям стало еще труднее. Что произошло с открытыми данными в России за последние месяцы — рассказываем в обновлении трекера «Если быть точным».
Подпишитесь на наш канал в Telegram или оставьте обратную связь с помощью бота
> > > >

К маю 2024 года власти удалили минимум 76 датасетов из разделов «открытые данные» ведомственных сайтов. Больше всего закрыл Роструд — 26 датасетов: в них содержались данные о различных соцвыплатах, а еще административная и справочная информация. Росприроднадзор удалил 19 датасетов, а Росздрав — 15: в основном это были реестры со справочной информацией вроде списка проведенных мероприятий.

Данные о соцвыплатах ранее частично закрыл и Росстат: в 2023 году из ежегодного бюллетеня социальных выплат исчезли строки с данными о выплатах ветеранам боевых действий. Также перестали публиковать общую сумму выплат, чтобы не допустить расчета удаленного показателя. По этим данным можно было бы приблизительно оценить число военнослужащих, задействованных в боевых действиях в Украине. 

Всего за 2,5 года с начала военных действий в Украине власти скрыли почти 600 наборов данных. Среди них — сведения о доходах и расходах чиновников, информация о госзакупках подсанкционных компаний, миграционная и экономическая статистика, любые показатели, по которым можно оценить потери российской армии в боевых действиях в Украине. Подробнее об этом мы рассказывали в финальном обновлении трекера за 2023 год. 

Как мы считали

Мы учитывали только те датасеты, которые выкладывались в разделах «открытые данные» на сайтах ведомств. Для этого мы составили список всех федеральных ведомств, а также государственных фондов (к ним относится, например, ФОМС). Через веб-архив проверили раздел открытых данных на сайте каждого ведомства, а затем сравнили с тем, что есть на сайте сейчас (проверку проводили за первые четыре месяца 2024 года).

Файлы и веб-страницы с неструктурированными данными, разбросанные по другим разделам сайтов, не включены в расчет. Обычно это различные доклады, реестры, формы статистической отчетности и текстовые отчеты, содержащие макроэкономические, финансовые и социальные показатели. Их тоже удаляют, иногда задним числом за все предыдущие годы, но поскольку эти данные публикуют несистемно, мы не можем оценить объемы удаленного.

Также в этот расчет не включены датасеты, которые публиковались на портале открытых данных.

 

Удаляют не только датасеты, которые чувствительны для государства, но даже, например, реестры со справочной информацией. Общей логики в том, что именно закрывают, не прослеживается. 

Приглашенный исследователь Йельского университета Кирилл Титаев считает, что данные перестают публиковать по двум причинам — это либо политическое решение, либо желание чиновников избежать проблем.

«Например, резкое затруднение доступа к данным из ЕГРН и искажение данных в самой базе — это противодействие журналистским расследованиям. Но очень часто бывает простой оппортунизм, — считает Титаев. — Чиновники видят, что внимание к этой сфере ослабло, что у них есть возможность оправдаться обеспечением безопасности государства, и перестают тратить на данные время и деньги».

Хорошая новость, по мнению эксперта, состоит в том, что подавляющее большинство тех датасетов, которые были в открытом доступе, скачаны исследователями.  «Но если раньше вы шли и брали их в первоисточнике, то сейчас надо смотреть, кто публиковался на этом датасете, и писать ему с просьбой поделиться», — говорит Титаев. 

В феврале 2023 года Госдума утвердила поправки в закон «Об официальном статистическом учете и системе государственной статистики в Российской Федерации». Теперь правительство может приостанавливать публикацию любых данных, собираемых в рамках федерального плана статистических работ. Первым и пока единственным прецедентом, когда данные закрыли именно со ссылкой на этот закон, стал запрет на публикацию статистики по добыче нефти и газа в 2023 году. В марте 2024 года запрет был продлен до апреля 2025-го. 

Согласно новым поправкам, закрывать данные теперь можно только по распоряжению правительства. Однако это правило соблюдается далеко не всегда. Так, в мае 2024-го Минэнерго закрыло данные о производстве бензина и дизельного топлива. Но соответствующего распоряжения правительства не было. «Учитывая существующую геополитическую ситуацию, раскрытие такой информации может стать поводом для манипулирования рынком со стороны недобросовестных его участников», — прокомментивало свои действия министерство. 

Закрывают не только отдельные показатели, но и целые порталы. Так, в конце февраля 2024 года перестал работать официальный агрегатор судебных дел ГАС «Правосудие». С 2006 года он помогал ученым и журналистам изучать, как работает судебная система. Теперь доступ к судебным данным возможен только через альтернативные инструменты — например, парсер «Если быть точным», который ищет данные о судебных делах и тексты судебных решений прямо на сайтах судов общей юрисдикции. 

В конце прошлого года в связи «с доработкой функциональности» перестали обновлять портал правовой статистики. До этого Генпрокуратура ежемесячно выкладывала на нем подробные данные о преступности в России — в абсолютных числах, в разрезе регионов и статей УК. 

В марте 2023 года на «техническое обслуживание» закрылся портал открытых данных: на главной странице разместили «заглушку», а датасеты удалили из свободного доступа. Технической необходимости в удалении всех данных не было. Согласно открытой  информации, часть работ уже выполнена, а сам портал планировалось открыть 1 июня 2024 года. Контракт обновлен 3 июня, дата исполнения работ — все также 1 июня, исполнитель платит штрафы.

«Портал для большинства данных, которые там содержались, не был единственным источником. — говорит Кирилл Титаев —  Например, он выгружал данные из ЕМИСС и Центробанка, но они лежали и на сайтах производителей данных. Если мы говорим про старые данные, то это не очень большая потеря, потому что мы знаем несколько архивов, которые выкачали оттуда более-менее все. Но то, что новые данные могут перестать публиковаться, если не полностью, то частично, — это, конечно, будет очень большой сложностью для исследователей».

Однако некоторые данные размещались только на портале, и сейчас недоступны — это 362 датасета Минобороны, Минспорта, Минэкономразвития, Минюста и ФСИН. 

К моменту закрытия на «техническое обслуживание» Портал содержал 27 тысяч наборов данных. Большинство из них (84%) были впервые загружены в период «Открытого правительства», причем пик обновлений наборов данных пришелся на 2017 год.

При этом портал чаще был объектом критики со стороны исследователей, чем «флагманом» открытых данных в России. По нашим расчетам, к началу 2023 года 60% наборов данных никогда не обновлялись, 30% никогда не загружались пользователями и только 2% (470 наборов данных) были загружены сто и более раз. 

После 24 февраля тенденция на закрытие данных становится все очевиднее. В июле 2022 года мы насчитали как минимум 10 ведомств, которые закрыли свою статистику. Сейчас их уже по меньшей мере 46. 

Но о полной закрытости российской статистики пока говорить рано. Данные скрываются непоследовательно: в одних наборах удаляют все, в других — только отдельные файлы. При этом иногда удаленную информацию можно найти на сайтах в виде текста или таблиц. 

Не стоит списывать со счетов и бюрократическую инерцию: чиновники, ответственные за открытые данные, по привычке продолжают публиковать информацию, а бюрократы среднего звена прикладывают усилия, чтобы защитить свою сферу влияния. Тем более, что некоторые данные нелегко удалить из доступа, поскольку вокруг них выстроена инфраструктура государственного регулирования и управления: налоговая статистика, решения судов, показатели для отчетности по национальным проектам, демографические данные и много что еще. Без них управлять страной и регионами будет трудно. 

Авторы: Борис Ги, Даниил Гурбанов 
Инфографика: Татьяна Цвирова, Екатерина Буркова
 

Материал был полезен?

«Если быть точным» — это данные с человеческим лицом.
Поддержите нас, чтобы мы могли и дальше помогать решать социальные проблемы.
Мы всегда рады вашим письмам
Присылайте ваши вопросы, отклики и предложения в телеграм-бот @tochnost_bot
Наши соцсети