Населенные пункты России: население, национальный состав и географические координаты
Что в данных: все населенные пункты России с численностью населения и национальным составом
Данные о национальном составе населения муниципалитетов и населенных пунктов России, собранные во время Всероссийской переписи населения 2020−2021 годов.
В наборе данных представлены сведения по каждому из более чем 155 тысяч населенных пунктов страны. Хотя оценка численности населения по итогам переписи может быть неточной, датасет остается ценным источником для анализа пространственного распределения населения, изучения демографических и этнокультурных особенностей регионов, а также оценки обеспеченности социальной, транспортной и коммунальной инфраструктурой.
Единица наблюдения в наборе данных — это населенный пункт, муниципалитет, регион или страна в целом. Для каждого наблюдения приводятся уровень и наименование территории, регион, муниципальное образование верхнего и нижнего уровня, код ОКТМО, численность населения, численность указавших национальную принадлежность, численность указавших каждую из 194 национальностей, а также количество отказавшихся от ответа с различными формулировками. Также датасет обогащен сведениями о географических координатах населенных пунктов с помощью сервиса DaData.
Данные о национальной принадлежности скрыты (заменены на код -9) для населенных пунктов с численностью населения 10 и менее человек, поскольку перепись гарантирует анонимность ответов респондентов. Суммарное значение для соответствующей колонки по всем населенным пунктам конкретного региона, данные по которым были скрыты, можно посмотреть в строках для которых object_level принимает значение «Регион (анонимизация)». Получить полную версию данных для использования исключительно в исследовательских целях можно по запросу, написав на в телеграм: @tochno_bot.
Набор доступен для работы в формате CSV (кодировка: «UTF-8», разделитель: «;»), XLSX и PARQUET, и содержит 176 148 наблюдений по 235 атрибутам.
Какие есть ограничения
Неточная оценка численности населения
Численность населения и численность каждой из национальностей даются по данным переписи. Существует немало указаний на то, что численность населения многих населенных пунктах может быть завышена или занижена — например, значительные отличия этих цифр от данных текущего учета. Кроме того, по данным Росстата, во время этой переписи более 10% респондентов не ответили на вопрос о национальности. Подробнее о качестве данных переписи населения можно прочитать в нашем тексте.
Двойной учет людей, указавших несколько национальностей
В официальных результатах переписи в каждой колонке с национальностью посчитаны только люди, указавшие ее в качестве первой или единственной. В данном датасете учитывались все ответы, названные респондентами. В связи с этим сумма значений по столбцам с национальностями может значительно превышать численность населения.
Если у вас есть вопросы по датасету, задавайте их в нашем телеграм-чате.
[#население][#демография][#национальность]
Показатели
- Численность населения
- Национальный состав
- Географические координаты населенных пунктов
