Отсутствие официальной статистики по уровню социально-экономического развития территорий или длительный лаг в ее опубликовании заставляет исследователей обращаться к альтернативным источникам данных, возникающим благодаря стремительному развитию цифровых технологий. Для работы с этими данными достаточно владеть интерпретируемым объектно-ориентированным языком программирования R. Целью статьи является знакомство читателя с возможностями программной среды R при формировании из разных источников муниципальной базы данных для социально-экономических исследований. В качестве источников данных рассмотрены: база данных Росстата «Показатели муниципальных образований»; форма налоговой отчетности 5-НДФЛ, сайт Федеральной налоговой службы; сайт Центральной избирательной комиссии Российской Федерации; сервис TurgetHunter. В рамках подготовительного этапа формирования базы данных показано, какие параметры необходимо учитывать при создании вспомогательной таблицы-ключа. На примере работы с данными разобраны функции left_join(), pivot_longer(), fill(), group_ by(), arrange(), summarize(), separate(). Изложенный материал можно использовать для разработки учебных задач в рамках дисциплин «Основы статистики» или «Анализ данных», а также для подготовки статистической базы для исследований социально-экономических процессов на муниципальном уровне
Сегодня цифровые способы общения активно вошли в нашу жизнь, социальные медиа являются привычным каналом для личной и деловой коммуникации, которым пользуются и органы власти. В статье предложен подход, позволяющий выявить уровень цифровизации территории на основе присутствия органов местного самоуправления в социальных медиа. Целью работы является идентификация проблемных муниципальных образований Северо-Западного федерального округа России по использованию в деятельности местных администраций возможностей Интернета по данным социальной сети «ВКонтакте». Эмпирическую базу исследования составляют данные о 1083 поселениях, 199 районах и округах за период с 2011 по 2022 г. по социально-экономическим характеристикам и сведениям о главе муниципального образования. С помощью бинарной логистической регрессии определяются значимые факторы, влияющие на уровень цифрового присутствия в социальных медиа. Для выявления искомых муниципалитетов проводится сопоставление результатов двух кластеризаций - по районным и поселенческим данным. Установлено, что численность населения, размер доходов и расходов бюджета, уровень бюджетной обеспеченности и средняя заработная плата положительно влияют на присутствие в социальных медиа, в то время как расстояние до регионального центра и принадлежность к районному центру оказывают отрицательное влияние. Вероятность появления в социальных медиа зависит от возраста, места проживания главы и способа его выдвижения на выборах. По результатам исследования четверть поселений была отнесена к требующим повышенного внимания при реализации мероприятий, направленных на развитие цифровых технологий и усиление присутствия в социальных медиа. Значительная часть этих поселений находится в Псковской, Новгородской и Вологодской областях.