Архив статей

ФОРМИРОВАНИЕ БАЗ ДАННЫХ В ПРОГРАММНОЙ СРЕДЕ R: ОПЫТ ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЙ НА МУНИЦИПАЛЬНОМ УРОВНЕ (2024)
Выпуск: Т. 3 № 4 (2024)
Авторы: Прокопьев Егор Александрович, Иголкин Владислав Александрович

Отсутствие официальной статистики по уровню социально-экономического развития территорий или длительный лаг в ее опубликовании заставляет исследователей обращаться к альтернативным источникам данных, возникающим благодаря стремительному развитию цифровых технологий. Для работы с этими данными достаточно владеть интерпретируемым объектно-ориентированным языком программирования R. Целью статьи является знакомство читателя с возможностями программной среды R при формировании из разных источников муниципальной базы данных для социально-экономических исследований. В качестве источников данных рассмотрены: база данных Росстата «Показатели муниципальных образований»; форма налоговой отчетности 5-НДФЛ, сайт Федеральной налоговой службы; сайт Центральной избирательной комиссии Российской Федерации; сервис TurgetHunter. В рамках подготовительного этапа формирования базы данных показано, какие параметры необходимо учитывать при создании вспомогательной таблицы-ключа. На примере работы с данными разобраны функции left_join(), pivot_longer(), fill(), group_ by(), arrange(), summarize(), separate(). Изложенный материал можно использовать для разработки учебных задач в рамках дисциплин «Основы статистики» или «Анализ данных», а также для подготовки статистической базы для исследований социально-экономических процессов на муниципальном уровне

Сохранить в закладках