ИЗВЕСТИЯ ЮФУ. ТЕХНИЧЕСКИЕ НАУКИ
Архив статей журнала
Выражение чувств - неотъемлемая часть человеческой жизни и коммуникации. Чтобы создать компьютеры, способные лучше служить человечеству, в области информатики продолжаются исследования по разработке алгоритмов машинного обучения, которые могут обрабатывать текстовые данные и выполнять задачи анализа тональности текстов на естественном языке. Доступность онлайн-обзоров и повышенные ожидания конечных пользователей также стимулируют разработку систем интеллектуального анализа мнений, которые могут автоматически классифицировать и обобщать отзывы пользователей. С каждым годом исследований в области распознавания эмоций в тексте все больше, но только малая их часть посвящена применению нечеткой логики. В основном, это происходит потому, что исследователи ограничиваются бинарной классификацией отношений - «положительное» и «отрицательное», реже добавляя еще третий класс - «нейтральное». Применение же нечеткой логики помогает определить оттенки эмоций, не просто «хорошо» и «плохо», а насколько хорошо или насколько плохо. Количество определяемых классов определяет глубину детализации. Ранее нами была предложена нечеткая модель определения тональности на основе словарей, в данном исследовании мы предлагаем улучшенную модель определения тональности текста на основе тонального словаря (SentiWordNet) и нечетких правил. Для повышения точности и достоверности анализа тональности были применены коэффициенты, учитывающие эмоциональную нагрузку слов разных частей речи и действие модификаторов интенсивности, способствующих усилению либо ослаблению эмоциональных оттенков. Количественное значение тональности текста получено в результате агрегирования нормированных данных по эмоциональным классам с применением методов нечеткого вывода. В результате исследования было выявлено, что учет влияния модификаторов интенсивности значительно повышает точность предложенного ранее авторами метода, а также способствует определению границ при проведении детализированной оценки отношений по 7 классам («очень положительное», «положительное», «скорее положительное», «нейтральное», «скорее отрицательное», «отрицательное», «очень отрицательное»).