Статья исследует территориальные различия социального самочувствия жителей Санкт-Петербурга, сопоставляя данные репрезентативного опроса и цифровые следы районных сообществ социальной сети ВКонтакте. В качестве аналитической рамки используется социология эмоций, а в качестве инструментария - методы машинного обучения и обработки естественного языка (NLP). Тематическое моделирование (LDA) применялось для выделения ключевых сфер городской повседневности, а ансамбль моделей для анализа тональности - для классификации более чем полумиллиона комментариев по пяти базовым эмоциональным категориям. Опросные данные позволили оценить субъективные характеристики городской среды и эмоциональные реакции жителей, тогда как цифровые следы зафиксировали ситуативные и коллективные формы выражения эмоций. Полученные результаты демонстрируют, что различия в социальном самочувствии устойчиво формируются на пересечении инфраструктурных особенностей районов, качества жилья, демографического состава и характера повседневных маршрутов. Данные социальных сетей уточняют и развивают опросные показатели, выявляя локальные точки напряжения - сбои инфраструктуры, «боли роста» новых территорий, хронические бытовые неудобства старых районов. Работа показывает, что сочетание опросов и автоматизированных методов анализа текстов позволяет рассматривать социальное самочувствие не как статичную оценку, а как динамический процесс, чувствительный к изменениям городской среды. Результаты исследования имеют прикладное значение для городской социальной политики и диагностики территориальных неравенств.
В статье описаны результаты исследования социального настроения горожан на основе текстовых данных из социальной сети ВКонтакте. Объект исследования – город Санкт-Петербург. Предлагаемый метод предполагает сопоставление тональности дискуссий пользователей социальных медиа с количественными данными, описывающими инфраструктуру города. Такое сопоставление возможно благодаря тому, что текстовые данные могут быть привязаны к району. Целью исследования было проанализировать возможности предлагаемого подхода, поэтому в качестве количественных данных взяты датасеты, описывающие инфраструктуру города по маркеру «поддержание здоровья»: количество поликлиник, больниц, площадок для занятия спортом. В статье описываются подходы к анализу тональности специфических текстовых данных (приводятся метрики качества используемых моделей), обосновывается актуальность связывания подобного рода данных с количественными показателями (статистиками, участвующими традиционно в методиках оценки благополучия городской среды). В работе продемонстрированы итоговые прикладные результаты: данные исследования нанесены на карту города.