ISSN 1818-1015 · EISSN 2313-5417
Язык: ru

Статья: МЕТОДЫ ОПРЕДЕЛЕНИЯ НЕЯВНО УПОМИНАЕМЫХ АСПЕКТОВ В ПУБЛИЦИСТИЧЕСКИХ ПРЕДЛОЖЕНИЯХ НА РУССКОМ ЯЗЫКЕ (2024)

Читать онлайн

В работе сравнивается качество работы различных методов определения неявно упоминаемых аспектов социально-экономической жизни в публицистических предложениях на русском языке. Задача определения неявно упоминаемых аспектов является вспомогательной для задач аспектно-ориентированного анализа тональности. Эксперименты проводились на корпусе предложений, извлечённых из политической агитации. Лучшие результаты, с F1-мерой, достигающей 0.84, были получены с использованием эмбеддингов Navec и классификаторов, основанных на методе опорных векторов. Достаточно высокие результаты, с F1-мерой до 0.77, были получены при использовании модели «мешок слов» и наивного байесовского классификатора. Остальные методы показали более низкие результаты. Также в ходе экспериментов было выявлено, что качество определения различных аспектов может достаточно сильно отличаться. Лучше всего определяются аспекты, с которыми в речи связаны характерные слова-маркеры, например, «здравоохранение» и «проведение выборов» Хуже всего определяются упоминания достаточно общих аспектов, таких как «качество управления».

Ключевые фразы: ОПРЕДЕЛЕНИЕ АСПЕКТОВ, НЕЯВНЫЕ АСПЕКТЫ, АНАЛИЗ ТОНАЛЬНОСТИ, ПУБЛИЦИСТИЧЕСКИЙ СТИЛЬ
Автор (ы): Полетаев Анатолий Юрьевич, Парамонов Илья Вячеславович, Колупаев Егор Михайлович
Журнал: МОДЕЛИРОВАНИЕ И АНАЛИЗ ИНФОРМАЦИОННЫХ СИСТЕМ

Идентификаторы и классификаторы

УДК
004.912. Обработка текста
eLIBRARY ID
69174192
Для цитирования:
ПОЛЕТАЕВ А. Ю., ПАРАМОНОВ И. В., КОЛУПАЕВ Е. М. МЕТОДЫ ОПРЕДЕЛЕНИЯ НЕЯВНО УПОМИНАЕМЫХ АСПЕКТОВ В ПУБЛИЦИСТИЧЕСКИХ ПРЕДЛОЖЕНИЯХ НА РУССКОМ ЯЗЫКЕ // МОДЕЛИРОВАНИЕ И АНАЛИЗ ИНФОРМАЦИОННЫХ СИСТЕМ. 2024. Т. 31 № 3
Текстовый фрагмент статьи