• Главная
  • Библиотека материалов
  • С 1990-х годов в России проводится панельное обследование домохозяйств — это уникальный источник данных о жизни россиян, который дополняет официальную статистику. Вот все, что вам нужно знать про базу РМЭЗ

С 1990-х годов в России проводится панельное обследование домохозяйств — это уникальный источник данных о жизни россиян, который дополняет официальную статистику. Вот все, что вам нужно знать про базу РМЭЗ

Больше 30 лет исследователи опрашивают одни и те же семьи, чтобы отслеживать изменения
Радикальные реформы девяностых, мировой финансовый кризис, пандемия коронавируса — за последние 30 лет жизнь россиян несколько раз менялась коренным образом. Как именно все эти события повлияли на конкретных людей и население в целом? Ответы на эти вопросы дает Российский мониторинг экономического положения и здоровья населения. Мониторинг ведется 30 лет — это главное в России обследование домохозяйств. На основе этих данных проведено 3,5 тысячи исследований. В конце августа опубликованы данные новой, 31-й волны. Объясняем, чем РМЭЗ отличается от всех других обследований и как пользоваться этими данными. 
> > > >

Исследование жизни россиян, которое длится больше 30 лет

Как узнать, на что россияне тратят деньги, как проводят время на работе и дома, следят ли за своим здоровьем и сколько детей планируют завести? Данные о том, как живут люди и как на их жизнь влияет происходящее в стране и мире, ученые собирают в ходе регулярных обследований населения. Это масштабные социологические опросы, в которых участвуют большие группы людей и на основании которых можно делать выводы о населении в целом. 

В России таких обследований на разные темыУровень жизни, бедность, рационы питания, работа и безработица, состояние здоровья, образование — вот лишь неполный перечень. проводится довольно много: только у Росстата их больше десяти. Но одно из них выделяется на общем фоне — это Российский мониторинг экономического положения и здоровья населения (кратко — РМЭЗ), который проводит Высшая школа экономики.

Это одно из двух (а до недавнего времениС 2023 года Банк России выкладывает в открытый доступ Всероссийское обследование домохозяйств по потребительским финансам. — единственное) панельных, или лонгитюдных, обследований домохозяйств в России. Это значит, что из года в годСтатистики называют такие повторяющиеся опросы волнами. исследователи опрашивают одни и те же семьи, точнее, домохозяйстваВ состав домохозяйства в РМЭЗ также включаются неженатые дети 18 лет и младше, которые временно живут отдельно в общежитии по месту учёбы. — людей, которые живут вместе в одном жилище и имеют общие доходы и расходы. В большинстве других обследований каждый раз опрашивают новых людей — такой метод называют кросс-секционным. 

РМЭЗ проводится с 1992 года, ежегодно — с 1994. Это период радикальных рыночных реформ, следствием которых стали  стремительный рост цен и резкое падение уровня жизни россиян. Чтобы отслеживать, как эти процессы влияют на людей,   профессор университета Северной Каролины в Чапел-Хилле Барри Попкин предложил запустить всероссийское репрезентативное обследование. Сбором данных занимался Госкомстат. 

Кто и как проводил обследование

Над дизайном исследования работала группа специалистов, которые позже образовали исследовательский центр «Демоскоп». Также в проекте участвовал Национальный центр превентивной медицины.

При создании РМЭЗ российские эксперты и иностранные консультанты опирались на опыт проведения аналогичных обследований в других странах. В международной практике первым масштабным примером стало американское «Панельное исследование динамики доходов (PSID)». Старт обследования в 1968 году пришелся на президентство Линдона Джонсона, по инициативе которого был запущен ряд социальных программПолучили название «Великое общество»., направленных на борьбу с бедностью и расовой сегрегацией.

Всего в рамках первой фазы РМЭЗ было проведено четыре волныИюль–октябрь 1992 года, декабрь 1992 года–март 1993 года, июль–сентябрь 1993 года и октябрь 1993 года–январь 1994 года. обследования. Вторая фаза стартовала в 1994 году. Обследование полностью перешло в руки «Демоскопа». Выборка была полностью пересмотрена, чтобы добавить панельную составляющую — исследователи заново отобрали домохозяйства, чтобы в дальнейшем можно было опрашивать их каждый год.

Панельные обследования помогают понять, как меняется жизнь конкретных респондентов. За счет этого можно сделать более точные выводы, как какие-то внешние изменения влияют на людей. 

Например, мы хотим узнать, как введение ЕГЭ повлияло на успеваемость школьников. В повторяющихся кросс-секционных исследованиях каждый раз будут принимать участие разные школьники. Есть риск, что в один год в выборку попадут, например, дети с большей способностью концентрироваться, а в другой — с меньшей. В результате может оказаться, что успеваемость изменилась — но не из-за введения экзамена, а из-за  особенностей респондентов. 

Проконтролировать такие факторы в кросс-секционном исследовании сложно. В панельном сделать это проще: в выборку попадают те же люди с теми же характеристиками (правда, со временем они тоже могут меняться, но риск меньше, чем в случае с разными людьми). 

При этом в панельных исследованиях сложнее добиться репрезентативностиТо есть того, чтобы характеристики выборки исследования соответствовали характеристикам населения в целом: например, чтобы среди опрошенных была такая же доля семей с детьми, как и по всей России. Репрезентативность нужна, чтобы делать выводы о населении в целом, а не только об отдельных респондентах.. По разным причинам выборка «усыхает»: с годами люди отказываются участвовать в исследовании, респонденты старших возрастов умирают. 

Чтобы сохранять репрезентативность, авторы РМЭЗ взяли за исходную единицу не людей, а жилищаТакой дизайн называют «повторяющейся выборкой» с «разделяющейся панелью». Впервые его предложил профессор Мичиганского Университета Лесли Киш.. Каждый год интервьюеры приходят в одни и те же дома и квартиры — если там появились новые жильцы, их тоже включают в выборку. Исследование проводится больше 30 лет: за это время дети стали взрослыми людьми, их родители — старшим поколением. При этом общий состав респондентов меняется примерно так, как в целом по стране. Какую-то долю домохозяйств, тем не менее, все-таки приходится заменять на новые. 

Какая доля респондентов участвует в опросе из года в год

Чтобы оценить, какая доля домохозяйств и индивидов продолжает участвовать в опросах на протяжении времени, рассчитывается специальный показатель — темп убывания выборки. Чем он ниже, тем лучше.

В РМЭЗ по сравнению с аналогичными зарубежными обследованиями темп убывания выборки достаточно низкий. Если взять какую-нибудь волну и посмотреть, какая доля домохозяйств принимает участие в обследовании в последующие годы, то в среднем получится, что через год в опросе участвует 87% домохозяйств, через два года — 80%, через пять лет — 67%, через 10 лет — 53%, а через 20 лет — 33% первоначально опрошенных домохозяйств. Для индивидов значения несколько ниже: через год — 85% респондентов все еще участвуют в обследовании, через два года после первого опроса — 77%, через пять лет — 62%, через 10 лет — 46%, через 20 лет — четверть первично опрошенных индивидов.

На низкий темп убывания влияет несколько причин. Во-первых, невысокая трудовая мобильность — люди в России просто мало переезжают. Во-вторых, организаторы обследования в 1997-1998 годах стали дополнительно опрашивать те домохозяйства, которые ранее участвовали в опросе, но переехали на новое место жительства в пределах того же населенного пункта. Это позволяет сохранить респондентов в выборке.

Как использовать данные РМЭЗ: три примера

Данные РМЭЗ публикуются в открытом доступе на сайте Высшей школы экономики, а также в репозитории Центра исследований населения Университета Северной Каролины в Чапел-Хилл. 

Респондентам РМЭЗ задают множество вопросов на самые разные темы: источники доходов и места работы, потребительские привычки, здоровье и образование, миграция, отношение респондентов к общественным проблемам. Отдельные опросники есть для домохозяйств, их взрослых жильцов и детей. До 2019 года для населенных пунктов, в которых проводилось обследование, заполнялись специальные анкеты про социальную инфраструктуру и цены на продукты питания. 

Некоторые показатели доступны только в РМЭЗ. Они не собираются в официальной статистике. Например, респондентов подробно спрашивают о здоровье и вредных привычках. А с 2020 года — о вакцинации от коронавируса и отношении к ней.

Как работать с файлами обследования

Можно скачать как выборки для отдельных волн, так и объединенные базы данных. Файлы обследования доступны в форматах IBM SPSS Statistics (.sav) и STATA (.dta). Это распространенные форматы публикации данных в социально-экономических науках. В Python для чтения файлов с расширением .sav можно использовать библиотеку pyreadstat, файлов с расширением .dta — стандартную библиотеку pandas, дополненную библиотекой pyreadstat. В R файлы обоих форматов можно прочитать с помощью пакета haven.

За последние тридцать лет было опубликовано почти 3,5 тысячи исследований, выполненных на данных РМЭЗ — в среднем новое исследование выходит каждые полтора дня. Из них 57% работ написаны на русском языке, 41% — на английском, еще несколько десятков — на других языках. Например, есть статья на португальском.

Выбрать из тысяч проведенных на данных РМЭЗ исследований главные практически невозможно. Вместо этого мы выбрали  три исследования, в которых авторы смогли извлечь из данных больше информации, чем было возможно на первый взгляд. Эти  приемы можно использовать и в других исследованиях. 

Найти в данных соседей 

В некоторых исследованиях важно учитывать влияние соседей и друзей (его еще называют «эффектом сверстников») на поведение и привычки людей. Например, паттерны потребления алкоголя во многом определяются социальным окружением, в котором человек взрослеет и живет.

В РМЭЗ первичный отбор домохозяйств в городах проводился в рамках переписных участков. Это территории, на которые делится страна при проведении переписи. Размер этой территории должен быть таким, чтобы переписчик мог за время проведения переписи обойти ее пешком. В среднем население одного переписного участка составляет 300 человек, а сам переписной участок объединяет несколько многоквартирных домов. В российских городах они, как правило, формируют двор. 

Вплоть до 17-й волныТак как выборка панельная, номер переписного участка можно восстановить и для последующих волн., исследователям был доступен уникальный номер переписного участка. Эту особенность использовал Евгений Яковлев, профессор Российской экономической школы и приглашенный исследователь Института политических исследований. 

Он задался вопросом, влияют ли на то, как и какой алкоголь потребляет человек, его соседи и сверстники. Чтобы найти эти группы людей в данных, Яковлев рассматривал респондентов, которые жили в границах того же переписного участка (то есть фактически в одном дворе) и были примерно одного возраста (исследователь брал возрастные когорты 18–29 лет, 30–39 лет, 40–49 лет и 50–65 лет).

Оказалось, что при потреблении алкоголя большую роль играет социальное окружение. Например, после повышения налогов на крепкий алкоголь человек переходит на менее крепкие напитки не только из-за того, что ему не хватает денег, но и из-за того, что его соседи тоже меняют потребительские привычки — теперь на застолья все приносят другие напитки.

Сочетать с муниципальной статистикой 

РМЭЗ проводится в 38 районах страны. Районы в этом случае — это и города, и районы как административная единица (например, Глазовский район Удмуртии). Москва, Санкт-Петербург и Московская область включались в выборку автоматически, так как в них проживает существенная часть населения страны. Остальные районы были выбраны случайным образом, но равномерно внутри больших территорий, на которые исследователи поделили страну по уровню урбанизации (например, Урал, Центрально-Черноземный регион — всего 10 таких крупных территорий). 

Исследователю доступнаПеременная psu в файлах с данными. информация о том, в каком конкретно районе проживает каждое домохозяйство. Эти данные можно объединить с официальной статистикой по этим районам. Так и поступили Анна Пестова, Михаил Мамонов и Даниил Кашкаров, чтобы понять, как доступность услуг детских садов влияет на занятость женщин с маленькими детьми. Именно для этой социальной группы уровень занятости в России существенно ниже, чем в других странах. 

Исследователи собрали для каждого района данные официальной статистики по доле детей, которые ходят в детский сад. Этот показатель использовали для оценки доступности детских садов. 

Данные РМЭЗ позволили оценить уровень занятости женщин с детьми в возрасте 0–2 лет в каждом из районов. Для сравнения исследователи оценили уровень занятости других групп женщин. Выяснилось, что доступность детских садов существенно увеличиваетРост доступности услуг детских садов на 10 процентных пунктов увеличивает вероятность занятости на 1.4-2.6 процентных пункта. вероятность занятости женщин с детьми в возрасте 0–2 лет.

Оценить эффекты реформ 

Реформы, которые проводит государство, обычно направлены на определенные социальные группы. В данных РМЭЗ для каждого респондента доступно множество характеристик, с помощью которых можно определить, попал человек под действие реформы или нет. Выражаясь научным языком, те, на кого реформа повлияла, формируют группу воздействия, а те, на кого нет — контрольную. Сравнивая эти группы между собой, можно оценить эффект реформы.

Важным изменением в российском образовании стало введение единого государственного экзамена в 2008 году. Он должен был упростить доступ выпускников из регионов к качественному высшему образованию. 

Влияние реформы на мобильность выпускников региональных школ оценили, воспользовавшись данными РМЭЗ, профессора Высшей школы экономики Фабиан Слонимчик и Анна Юрко, а также профессор университета в Эссексе Марко Франческони. Для этого они сравнили тех, кто в год проведения реформы учился в выпускном классе старшей школы, с теми, кто в выпускном классе не учился. Исследование показало, что введение ЕГЭ существенно увеличило долю учеников выпускного класса, которые после выпуска из школы переехали в другой регион.

Если собрать все уникальные вопросы, которые задавались респондентам РМЭЗ с 1994 года, то их окажется более 2,8 тысячи. Мы сохранили единый кодбук в формате гугл-таблицы. С ее помощью можно быстро понять, есть ли в РМЭЗ нужные для вашего исследования данные.

Если у вас есть вопросы о том, как работать с РМЭЗ, напишите нам в телеграме — мы постараемся помочь.

Автор: Витовт Копыток

Инфографика: Артем Иволгин, Екатерина Буркова
 

Материал был полезен?

«Если быть точным» — это данные с человеческим лицом.
Поддержите нас, чтобы мы могли и дальше помогать решать социальные проблемы.
Мы всегда рады вашим письмам
Присылайте ваши вопросы, отклики и предложения в телеграм-бот @tochnost_bot
Наши соцсети