Статья посвящена задаче определения тональности по отношению к аспектам социально-экономического развития в предложениях на русском языке. Аспект, отношение к которому определяется, может как упоминаться явно, так и подразумеваться. Авторами были исследованы возможности применения нейросетевых классификаторов, а также предложен алгоритм определения тональности по отношению к аспекту, основанный на семантических правилах, реализованных с использованием деревьев синтаксических единиц. Тональность по отношению к аспекту определяется в два этапа. На первом этапе в предложении отыскиваются аспектные термины — явно упоминаемые события или явления, связанные с аспектом. На втором этапе тональность по отношению к аспекту определяется как тональность по отношению к аспектному термину, который теснее всего связан с аспектом. В работе предлагается несколько методов поиска аспектных терминов. Качество оценивалось на корпусе из 468 предложений, извлечённых из материалов предвыборной агитации. Лучший результат для нейросетевых классификаторов был получен с использованием нейронной сети BERT-SPC, предобученной на задаче определения тональности по отношению к явно упоминаемому аспекту, макро-F-мера составила 0.74. Лучший результат для алгоритма, основанного на семантических правилах, был получен при использовании метода поиска аспектных терминов на основе семантической схожести, макро-F-мера составила 0.63. При объединении BERT-SPC и алгоритма, основанного на правилах, в ансамбль была получена макро-F-мера, равная 0.79, что является лучшим результатом, полученным в рамках работы.
Идентификаторы и классификаторы
- SCI
- Информатика
Задача определения тональности по отношению к упоминаемому в предложении аспекту заключается в определении, относится ли автор предложения к некоторому аспекту, о котором идёт речь в предложении, положительно, отрицательно или нейтрально. Отличие от задачи определения тональности по отношению к явно упоминаемому аспекту состоит в том, что неизвестно, сообщает ли автор о своём отношении к аспекту с использованием самого названия аспекта, или же он делает это как-то иначе.
Список литературы
1. B. Liu, Sentiment Analysis and Opinion Mining. Springer, 2022.
2. W. Zhang, X. Li, Y. Deng, L. Bing, and W. Lam, “A survey on aspect-based sentiment analysis: Tasks, methods, and challenges,” IEEE Transactions on Knowledge and Data Engineering, vol. 35, no. 11, pp. 11019-11038, 2022, https://doi.org/10.1109/TKDE.2022.3230975.
3. O. Alqaryouti and others, “Aspect-based sentiment analysis using smart government review data,” Applied Computing and Informatics, vol. 20, no. 1/2, pp. 142-161, 2024, https://doi.org/10.1016/j.aci.2019.11.003.
4. A. Nazir, Y. Rao, L. Wu, and L. Sun, “Issues and challenges of aspect-based sentiment analysis: A comprehensive survey,” IEEE Transactions on Affective Computing, vol. 13, no. 2, pp. 845-863, 2020, https://doi.org/10.1109/TAFFC.2020.2970399.
5. A. Poletaev, I. Paramonov, and E. Kolupaev, “Methods of implicit aspect detection in Russian publicism sentences,” Modeling and Analysis of Information Systems, vol. 31, no. 3, pp. 226-239, 2024, https://doi.org/10.18255/1818-1015-2024-3-226-239.
6. A. D. Kazun, “Construction of social problems in the media and agenda-setting theory: the limits of concepts’ compatibility,” Monitoring of Public Opinion: Economic and Social Changes, no. 3 (133), pp. 159-172, 2016, https://doi.org/10.14515/monitoring.2016.3.09.
7. A. I. Guseva, I. A. Kuznetsov, P. V. Bochkarev, and D. S. Smirnov, “DIGITAL SHADOW OF Russian INTERNATIONAL MEGAPROJECTSB OF NPP CONSTRUCTION ABROAD: ASSESSMENT OF THE TONE OF UTTERANCES,” Modern High Technologies, no. 12 (1), pp. 26-34, 2022, https://doi.org/10.17513/snt.39432.
8. W. Zhang, X. Li, Y. Deng, L. Bing, and W. Lam, “A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges,” IEEE Transactions on Knowledge and Data Engineering, vol. 35, no. 11, pp. 11019-11038, 2023, https://doi.org/10.1109/TKDE.2022.3230975.
9. E. G. Brunova, Y. V. Bidulya, and A. A. Gorbunov, “Aspect-based sentiment analysis of political discourse,” Tyumen State University Herald. Humanities Research. Humanitates, vol. 7, no. 3 (27), pp. 6-22, 2021, https://doi.org/10.21684/2411-197X-2021-7-3-6-22.
10. Muljono, B. Harjo, and R. Abdullah, “Aspect-Based Sentiment Analysis for Financial Review with Implicit Aspect and Opinion Using Semantic Similarity and Hybrid Approach,” International Journal of Intelligent Engineering & Systems, vol. 17, no. 5, pp. 646-658, 2024, https://doi.org/10.22266/ijies2024.1031.49.
11. K. Ananthajothi, K. Karthikayani, and R. Prabha, “Explicit and implicit oriented Aspect-Based Sentiment Analysis with optimal feature selection and deep learning for demonetization in India,” Data & Knowledge Engineering, vol. 142, p. 102092, 2022, https://doi.org/10.1016/j.datak.2022.102092.
12. C. Hutto and E. Gilbert, “VADER: A parsimonious rule-based model for sentiment analysis of social media text,” in Proceedings of the International AAAI Conference on Web and Social Media, 2014, vol. 8, no. 1, pp. 216-225.
13. N. Chechneva, “Simple and Efficient Approach to the Aspect Extraction from Customers’ Product Reviews,” in Proceedings of the 26th Conference of Open Innovations Association FRUCT, 2020, pp. 67-73, https://doi.org/10.23919/fruct48808.2020.9087546.
14. A. Poletaev, I. Paramonov, and E. Boychuk, “Automatic Detection of Sentiment Towards Explicit Aspect in Russian Publicism Sentences Using Syntactic Structure,” in Proceedings of the 36th Conference of Open Innovations Association FRUCT, 2024, pp. 593-602.
15. M. A. Pil’gun, “Rechevye osobennosti politicheskoj kommunikacii,” Proceedings of Kazan University. Humanities Sciences Series, vol. 152, no. 2, pp. 236-246, 2010.
16. Y. Song and others, “Targeted Sentiment Classification with Attentional Encoder Network,” in Artificial Neural Networks and Machine Learning - ICANN 2019: Text and Time Series, 2019, pp. 93-103, https://doi.org/10.1007/978-3-030-30490-4_9.
17. J. Ansel and others, “PyTorch 2: Faster Machine Learning Through Dynamic Python Bytecode Transformation and Graph Compilation,” in ASPLOC’24: Proceedings of the 29th ACM International Conference on Architectural Support for Programming Languages and Operating Systems, Volume 2, 2024, pp. 929-947, https://doi.org/10.1145/3620665.3640366.
18. A. Naumov and others, “Neural-network method for determining text author’s sentiment to an aspect specified by the named entity,” in CEUR Workshop Proceedings, 2020, vol. 2648, pp. 134-143.
19. Y. Wang, L. Wu, J. Li, X. Liang, and M. Zhang, “Are the BERT family zero-shot learners? A study on their potential and limitations,” Artificial Intelligence, vol. 322, p. 103953, 2023, https://doi.org/10.1016/j.artint.2023.103953.
20. A. Golubev, N. Rusnachenko, and N. Loukachevitch, “RuSentNE-2023: Evaluating Entity-Oriented Sentiment Analysis on Russian News Texts,” in Computational Linguistics and Intellectual Technologies: Papers from the Annual conference “Dialogue” (2023), 2023, vol. 22, pp. 130-141, https://doi.org/10.28995/2075-7182-2023-22-130-141.
21. D. Ma and others, “Interactive attention networks for aspect-level sentiment classification,” in Proceedings of the 26th International Joint Conference on Artificial Intelligence, 2017, pp. 4068-4074, https://doi.org/10.5555/3171837.3171854.
22. A. Y. Poletaev, I. V. Paramonov, and E. I. Boychuk, “Semantic rule-based sentiment detection algorithm for Russian publicism sentences,” Modeling and Analysis of Information Systems, vol. 30, no. 4, pp. 394-417, 2023, https://doi.org/10.18255/1818-1015-2023-4-394-417.
23. A. Y. Poletaev, I. V. Paramonov, and E. I. Boychuk, “Algorithm of constituency tree from dependency tree construction for a Russian-language sentence,” Informatics and Automation, vol. 22, no. 6, pp. 1323-1353, 2023, https://doi.org/10.15622/ia.22.6.3.
24. D. Chandrasekaran and V. Mago, “Evolution of semantic similarity - a survey,” ACM Computing Surveys (CSUR), vol. 54, no. 2, pp. 1-37, 2021, https://doi.org/10.1145/3440755.
25. A. Kutuzov and E. Kuzmenko, “WebVectors: A Toolkit for Building Web Interfaces for Vector Semantic Models,” in Analysis of Images, Social Networks and Texts: 5th International Conference, AIST 2016, Yekaterinburg, Russia, April 7--9, 2016, Revised Selected Papers, Cham: Springer International Publishing, 2017, pp. 155-161.
26. M. Korobov, “Morphological Analyzer and Generator for Russian and Ukrainian Languages,” in Analysis of Images, Social Networks and Texts, vol. 542, Springer International Publishing, 2015, pp. 320-332.
27. P. Qi and others, “Stanza: A Python Natural Language Processing Toolkit for Many Human Languages,” in Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: System Demonstrations, 2020, pp. 101-108, https://doi.org/10.18653/v1/2020.acl-demos.14.
Выпуск
Другие статьи выпуска
Эта статья посвящена использованию метода верификации моделей для точного теста планируемости систем реального времени, выполняющихся на мультипроцессорных платформах. Чтобы использовать этот метод, мы формально описываем системы реального времени с абстрактным планировщиком, используя модели Крипке. Эта формализация содержит термины, достаточные для специализации абстрактного планировщика. Мы иллюстрируем наш подход, явно определяя планировщики, которые учитывают вытеснение/невытеснение задач и глобальный фиксированный приоритет или приоритет ближайшего дедлайна в различных сочетаниях. Свойство безопасности (планируемости) систем реального времени сформулировано с помощью линейной темпоральной логики LTL. Формализация систем реального времени как моделей Крипке и задание свойства безопасности (планируемости) как формулы LTL позволяет свести точный тест планируемости таких систем к задаче верификации моделей. Мы апробируем этот подход к точному тесту планируемости, реализуя на Promela — входном языке инструмента верификации моделей SPIN — нашу формализацию систем реального времени с невытесняющим планировщиком с глобальным фиксированным приоритетом (NP-GFP), вытесняющим планировщиком с глобальным фиксированным приоритетом (P-GFP), невытесняющим планировщиком с приоритетом ближайшего дедлайна (NP-EDF) и вытесняющим планировщиком с приоритетом ближайшего дедлайна (P-EDF). Мы проводим эксперименты в SPIN для доказательства/опровержения свойства безопасности (планируемости), чтобы оценить эффективность нашего подхода. Мы предлагаем эвристическую оценку планируемости системы реального времени на основе доказуемости небезопасности и недоказуемости безопасности системы реального времени при выполнении на мультипроцессорных платформах с числом процессоров, отличающимся на единицу.
Взаимодействие в открытых сетях несёт определённые риски. Для обеспечения информационной безопасности участников сетевого взаимодействия используют криптографические протоколы. Высокие гарантии безопасности могут быть достигнуты в результате их формальной верификации. Распространённым формальным методом верификации криптографических протоколов является метод проверки модели. В работе для проверки модели криптографических протоколов предлагается использовать инструментальное средство TLA+/TLC, широко применяемое на практике в различных прикладных областях. На языке спецификации TLA+ задаётся модель протокола, а также требуемые свойства безопасности в форме инвариантов. Модель протокола описывает его поведение в виде системы переходов, содержащей все возможные состояния модели протокола и переходы между ними. Для проведения автоматической проверки соответствия модели требуемым свойствам задействуется верификатор TLC. Задача верификации криптографических протоколов имеет свою специфику. Настоящее исследование предлагает три приёма моделирования, учитывающих особенности данной задачи и используемого инструментария TLA+/TLC. Первый приём моделирования состоит в замене системы, состоящей из произвольного количества агентов, на трёхагентную систему. Это позволяет упростить модель и уменьшить её пространство состояний. Второй приём связан с представлением передаваемых сообщений в виде иерархической структуры — это даёт возможность вкладывать одни зашифрованные сообщения в другие. Третий приём состоит в оптимизации модели с целью повышения производительности верификатора TLC. Это выполняется путем задания функции, порождающей множество только тех элементов, которые приводят к переходам между состояниями в модели. В итоге предложенные приёмы позволяют упростить модель и снизить время её верификации. Применение результатов демонстрируется на примере простого протокола — протокола Нидхема-Шредера для аутентификации с открытым ключом. После обнаружения верификатором TLC известной уязвимости этого протокола выполняется моделирование и верификация его доработанной версии. Результаты верификации показывают, что новая версия протокола не имеет данной уязвимости.
В работе рассматривается класс расширенных регулярных выражений с обратными ссылками, которые представляются как элементы полукольца, частично удовлетворяющего теоремам алгебры Клини. Используя эти теоремы в качестве правил переписывания, возможно построить алгоритм устранения неоднозначности в ячейках памяти выражений. В дальнейшем этот алгоритм может быть применён для построения обращений расширенных регулярных выражений в заданных ограничениях. Предложенные алгоритмы были апробированы на тестовой выборке регулярных выражений, построенных на базе выражений из RegexLib и StackOverflow. Результаты экспериментов показали, что в ряде случае время сопоставления с преобразованным регулярным выражением было значительно меньше, чем с исходным.
Процесс-ориентированное программирование — это подход к разработке управляющего программного обеспечения, в котором программа определяется как набор взаимодействующих процессов. PoST — это процесс-ориентированный язык, который является расширением языка ST из стандарта IEC 61131-3. В области разработки управляющего программного обеспечения формальная верификация играет важную роль вследствие необходимости обеспечения высокой надежности такого программного обеспечения. Дедуктивная верификация — это метод формальной верификации, в котором программа и требования к ней представляются в виде логических формул, а для доказательства того, что программа удовлетворяет требованиям, используется логический вывод. К управляющему программному обеспечению часто предъявляются темпоральные требования. Мы формализуем такие требования для процесс-ориентированных программ в виде инвариантов цикла управления. Но инварианты цикла управления, представляющие требования, недостаточны для доказательства корректности программы. Поэтому мы добавляем дополнительные инварианты, которые содержат вспомогательную информацию. В данной статье рассматривается проблема автоматизации дедуктивной верификации процесс-ориентированных программ. Предложен подход, в котором темпоральные требования задаются с использованием шаблонов требований, которые строятся из базовых шаблонов. Для каждого шаблона требований определяются соответствующий шаблон дополнительных инвариантов и леммы. В статье описан предлагаемый подход и схемы базовых и производных шаблонов требований. Рассмотрены схемы базовых шаблонов дополнительных инвариантов, схемы лемм, определяемых для базовых шаблонов, а также набор базовых шаблонов и леммы для них. Определены схема производных шаблонов дополнительных инвариантов и схемы лемм, определяемых для производных шаблонов. Представлены алгоритмы построения производных шаблонов дополнительных инвариантов и лемм для них, а также метод доказательства этих лемм. Рассмотрены схемы доказательства условий корректности. Предложенный подход демонстрируется на примере. Также проведен анализ связанных работ.
Издательство
- Издательство
- ЯрГУ им. П.Г. Демидова
- Регион
- Россия, Ярославль
- Почтовый адрес
- 150003, Ярославль, Советская, 14,
- Юр. адрес
- 150003, Ярославль, Советская, 14,
- ФИО
- Иванчин Артем Владимирович (Ректор)
- E-mail адрес
- rectorat@uniyar.ac.ru
- Контактный телефон
- +7 (485) 2797702