Социальные медиа играют ключевую роль в современной коммуникации. Основным элементом текстового контента в социальных медиа выступают нарративы, которые передают последовательность событий и отражают авторскую точку зрения. По мере роста объёма пользовательских данных задача автоматизированного извлечения нарративов из текста становится всё более востребованной. Целью статьи является сравнительный анализ существующих методов, подходов и инструментов для автоматизированного извлечения нарратива с последующей формализацией их структуры. Такая формализация необходима для алгоритмизации процесса извлечения нарратива с использованием NLP-инструментов (Natural Language Processing). В работе рассмотрены ключевые подходы к представлению нарративов, включая методы на основе мешка слов, семантических аннотаций, онтологий и векторных представлений (word embeddings). Проанализированы их ограничения и область применения. Особое внимание уделено возможностям адаптации этих методов для анализа коротких и фрагментированных текстов, характерных для социальных медиа (например, постов, твитов). Результаты исследования могут быть полезны для разработки алгоритмов анализа нарративов, что открывает новые перспективы для применения в маркетинговых исследованиях, анализе общественного мнения и психолингвистике.
Идентификаторы и классификаторы
- SCI
- Образование
Под нарративом понимают упорядоченную последовательность событий, представленную через призму восприятия рассказчика [1]. Нарратив может существовать в различных форматах: текстовом (например, романы, посты), графическом (комиксы) или аудиальном (подкасты).
Если у вас возникли вопросы или появились предложения по содержанию статьи, пожалуйста, направляйте их в рамках данной темы.
Список литературы
1. Моштылёва Е.С. Модели наррации в современной русскоязычной интернет-коммуникации: лингво-прагматический и лингвостилистический анализ: автореф. дис.. канд. филол. наук: 10.02.01. - Н. Новгород, 2021. - 22 с.
2. Sevilla-Liu A. The theoretical basis of a functional-descriptive approach to qualitative research in CBS: With a focus on narrative analysis and practice // Journal of Contextual Behavioral Science. - 2023. - Vol. 30. - P. 210-216. DOI: 10.1016/j.jcbs.2023.11.001 EDN: KDLBSY
3. Of hopeful narratives and historical injustices - An analysis of just transition narratives in European coal regions / L. Hermwille, M. Schulze-Steinen, V. Brandemann, M. Roelfes, Z. Vrontisi, E. Keskula, A. Anger-Kraavi, L. Trembac-zowski, W. Mandrysz, R. Muster, A. Zygmunt-Ziemianek // Energy Research & Social Science. - 2023. - Vol. 104. - P. 103263. DOI: 10.1016/j.erss.2023.103263 EDN: HFYPLS
4. Complex Temporal Question Answering on Knowledge Graphs / Z. Jia, S. Pramanik, R.R. Saha, G. Weikum // Proceedings of the 30th ACM International Conference on Information & Knowledge Management. - 2021. DOI: 10.1145/3459637.3482416
5. What a Publication Tells You - Benefits of Narrative Information Access in Digital Libraries / H. Kroll, F. Plötzky, J. Pirklbauer, W. Balke // Proceedings of the 22nd ACM/IEEE Joint Conference on Digital Libraries. - 2022. DOI: 10.1145/3529372.3530928
6. A survey on narrative extraction from textual data / B. Santana, R. Campos, E. Amorim, A. Jorge, P. Silvano, S. Nunes // Artificial Intelligence Review. - 2023. - Vol. 56, Iss. 8. - P. 8393-8435. DOI: 10.1007/s10462-022-10338-7 EDN: DYZDAM
7. Computational Understanding of Narratives: A Survey / P. Ranade, S. Dey, A. Joshi, T. Finin // IEEE Access. - 2022. - Vol. 10. - P. 101575-101594. 10.1109/ACCESS.2022. 3205314. DOI: 10.1109/ACCESS.2022.3205314 EDN: SNBVZN
8. A survey of discourse parsing / J. Li, M. Liu, B. Qin, T. Liu // Frontiers of Computer Science. - 2022. - Vol. 16, Iss. 5. - P. 165329. DOI: 10.1007/s11704-021-0500-z EDN: VLEWMP
9. Piper A. Narrative Theory for Computational Narrative Understanding / A. Piper, R.J. So, D. Bamman // Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing. - 2021. DOI: 10.18653/v1/2021.emnlp-main.26 EDN: ZPJMTM
10. “Бедная русская мысль”: получим ли мы автоматизированное извлечение нарратива? / Л.О. Алгави, И.И. Волкова, Ш.Н. Кадырова, А. Масленникова, Н.Е. Расторгуева. - 2019. DOI: 10.13140/RG.2.2.33111.52640 EDN: SRIEIO
11. Mani I.Computational Modeling of Narrative // Synthesis Lectures on Human Language Technologies. - 2012. - Vol. 5, Iss. 3. - P. 1-142. 10.2200/S00459ED1V01Y 201212HLT018. DOI: 10.2200/S00459ED1V01Y201212HLT018
12. Евстигнеева Н.В. Модели анализа нарратива / Н.В. Евстигнеева, О.А. Оберемко // Южно-российский журнал социальных наук. - 2007. - Вып. 4. - С. 95-107. EDN: PZVHCT
13. Clinical narrative-aware deep neural network for emergency department critical outcome prediction / M. Chen, T. Huang, T. Chen, P. Boonyarat, Y.C. Chang // Journal of Biomedical Informatics. - 2023. - Vol. 138. - P. 104284. DOI: 10.1016/j.jbi.2023.104284 EDN: SFKVVZ
14. Gender Stereotypes in Hollywood Movies and Their Evolution over Time: Insights from Network Analysis / A.M. Kumar, J.Y.Q. Goh, T.H.H. Tan, C.S.Q. Siew // Big data and cognitive computing, - 2022. - Vol. 6 (50). DOI: 10.3390/bdcc6020050 EDN: LSQLBZ
15. The DISRPT 2021 Shared Task on Elementary Discourse Unit Segmentation, Connective Detection, and Relation Classification / A. Zeldes, P. Muller, Y.J. Liu, C. Braud, M. Iruskieta, S. Badene // Proceedings of the 2nd Shared Task on Discourse Relation Parsing and Treebanking (DISRPT 2021). - 2021. DOI: 10.18653/v1/2021.disrpt-1.1
16. Crash narrative classification: Identifying agricultural crashes using machine learning with curated keywords / J. Kim, A.B. Trueblood, H. Kum, E.M. Shipp // Traffic Injury Prevention. - 2020. - Vol. 22, Iss. 1. - P. 74-78. DOI: 10.1080/15389588.2020.1836365 EDN: UCKNLW
17. Modeling Human Mental States with an Entity-based Narrative Graph / I. Lee, M.L. Pacheco, D. Goldwasser // Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. - 2021. 10.18653/v1/ 2021.naacl-main.391. DOI: 10.18653/v1/2021.naacl-main.391
18. From Discourse to Narrative: Knowledge Projection for Event Relation Extraction / J. Tang, H. Lin, M. Liao, Y. Lu, X. Han, L. Sun, W. Xie, J. Xu // Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing. - 2021. DOI: 10.18653/v1/2021.acl-long.60
19. Meghini C. Representing narratives in digital libraries: The narrative ontology / C. Meghini, V. Bartalesi, D. Metilli // Semantic Web. - 2021. - Vol. 12, Iss. 2. - P. 241-264. DOI: 10.3233/SW-200421 EDN: BYVRKP
20. Joint event extraction along shortest dependency paths using graph convolutional networks / A. Balali, M. Asadpour, R. Campos, A. Jatowt // Knowledge-Based Systems. - 2020. - Vol. 210. - P. 106492. 10.1016/j.knosys. 2020.106492. DOI: 10.1016/j.knosys.2020.106492 EDN: YEOEWA
21. Event Extraction and Representation: A Case Study for the Portuguese Language / P. Quaresma, V.B. Nogueira, K. Raiyani, R. Bayot // Information. - 2019. - Vol. 10, Iss. 6. - P. 205. DOI: 10.3390/info10060205
22. Long-tail Relation Extraction via Knowledge Graph Embeddings and Graph Convolution Networks / N. Zhang, S. Deng, Z. Sun, G. Wang, X. Chen, W. Zhang, H. Chen // Proceedings of the 2019 Conference of the North. - 2019. DOI: 10.18653/v1/N19-1306
23. A knowledge extraction and representation system for narrative analysis in the construction industry / C.L. Yeung, C.F. Cheung, W.M. Wang, E. Tsui // Expert Systems with Applications. - 2014. - Vol. 41, Iss. 13. - P. 5710-5722. DOI: 10.1016/j.eswa.2014.03.044
24. Chambers N. Unsupervised learning of narrative schemas and their participants / N. Chambers, D. Jurafsky // Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP. - 2009. DOI: 10.3115/1690219.1690231
25. Universal Dependencies / M. Marneffe, J. Nivre, C.D. Manning, D. Zeman // Computational Linguistics. - 2021. - P. 1-54. DOI: 10.1162/coli_a_00402
26. Damonte M. An Incremental Parser for Abstract Meaning Representation / M. Damonte, S.B. Cohen, G. Satta // Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics. - 2017. DOI: 10.18653/v1/E17-1051
27. Пропп В.Я. Морфология волшебной сказки. - СПб.: Питер, 2021. - 256 с. EDN: LROTGT
28. Droog-Hayes M. Automatic Detection of Narrative Structure for High-Level Story Representation / M. Droog-Hayes, G. Wiggins, M. Purver // AISB 2019 Convention: Computational Creativity 2019. - Falmouth: AISB, 2018 [Электронный ресурс]. - Режим доступа: https://www.rese-archgate.net/publication/327579332_Automatic_Detection_of_Narrative_Structure_for_High-Level_Story_Representation, свободный (дата обращения: 01.04.2025).
29. TimeML Annotation Guidelines / S. Roser, J. Moszkowicz, B. Knippen, R. Gaizauskas, A. Setzer, J. Pustejovsky // TimeML Annotation Guidelines, Version 1. - 2006 [Электронный ресурс]. - Режим доступа: https://www.research-gate.net/publication/248737128_TimeML_Annotation_Guidelines_Version_121, свободный (дата обращения: 04.04.2024).
Выпуск
Другие статьи выпуска
Работа посвящена особенностям разработки высокочастотного прямоходового преобразователя напряжения для аппаратуры радиосвязи. Рассмотрены основные способы реализации активного ограничения коммутационных перенапряжений при применении планарных трансформаторов и высокой частоте преобразования. При компьютерном моделировании обнаружены недостатки известных способов реализации активного клампа с управлением от обмотки трансформатора и предложены способы их устранения и уменьшения их влияния. Макетирование предложенных решений подтвердило их работоспособность и эффективность.
Актуальность статьи обусловлена современными требованиями к обработке больших объёмов данных, которые привели к значительному повышению уровня информационных технологий и появлению технологии искусственного интеллекта. В настоящее время технология искусственного интеллекта широко используется при построении, оптимизации и эксплуатации информационно-телекоммуникационных сетей. Цель статьи - обоснование влияния технологии искусственного интеллекта на задачи, решаемые с помощью информационно-телекоммуникационных сетей. Объект исследования - технология искусственного интеллекта. Предмет исследования - технология искусственного интеллекта в информационно-телекоммуникационных сетях. Научная новизна - обоснование использования технологии искусственного интеллекта для обеспечения производительности и безопасности информационно-телекоммуникационных сетей в различных областях.
Нейронные сети (НС) являются эффективным инструментом решения трудно формализуемых задач, что сделало их незаменимым инструментом для их решения. Однако методики информационной защиты в данной области всё ещё не имеют достаточного уровня защиты, что делает их уязвимыми для киберпреступников. В данной статье исследуются состязательные атаки на НС, их особенности, а также предлагается новая методика обнаружения состязательных атак.
Представлен новый подход к идентификации вредоносных программ. В его основе лежит идея интеграции методов анализа поведения программ с современными алгоритмами машинного обучения. Процесс включает дизассемблирование программ, построение графа потока управления, выявление поведенческих паттернов в изолированной среде, извлечение метаинформации и классификацию программ по 3 классам. Алгоритмической основой разработанного подхода является ансамбль из графовой и гибридной нейронных сетей. Целью графовой сети является анализ графа потока управления, а гибридной - анализ статических и динамических признаков, определенных Cockoo Sandbox, а также ассемблерного кода, полученного в результате реверс-инжиниринга. Подход на базе такого ансамбля демонстрирует точность 0,88 в классификации кода на легитимный, вредоносный и APT-вредоносный и 0,94 - на легитимный и вредоносный.
Представлен программный комплекс, предназначенный для исследования особенностей параметров речевого сигнала. Данный комплекс планируется применить для разработки параметрического описания звуков и(или) групп звуков. Представленный комплекс создавался на основе алгоритмов, разработанных А. А. Коневым с учетом предъявленных требованиях для модификации предыдущей версии комплекса. Описаны структура, архитектура и основные блоки данного комплекса.
Предложен гибридный алгоритм для построения разреженной регрессии. Выполнено тестирование алгоритма с использованием реальных и синтетических данных. Результаты проведенных экспериментов свидетельствуют о возможности применения алгоритма к рассматриваемым задачами и демонстрируют его эффективность в сравнении с известными методами.
Представлены результаты моделирования возникновения пробоя в гетероструктуре транзистора с высокой подвижностью электронов при различной толщине барьерного слоя AlGaAs. В результате исследования было выявлено, что напряжение пробоя, измеренное по методу инжекции тока стока, при заданных параметрах гетероструктуры составляет 8,75 В и остается неизменным при изменении толщины барьерного слоя.
Рассматривается модель схемы активной балансировки литий-ионных аккумуляторов (ЛИА) на обратноходовых преобразователях, практически не уступающая схемам пассивной балансировки в быстродействии. Модель реализована с использованием Spice-моделей базовых компонентов, таких, как резисторы, ключи и т. д. без привязки к решениям от конкретных производителей, что позволяет повторить результат, с использованием отечественной компонентной базы, устойчивой к факторам космического пространства, что актуально для космической техники. Схемы активной балансировки позволяют проводить балансировку напряжений в ЛИА более энергоэффективно, перераспределяя электрическую энергию между всеми аккумуляторами в батарее. Использование систем активной балансировки на обратноходовых преобразователях позволяет эффективно выравнивать напряжения на аккумуляторах разной емкости, что особенно актуально для космических аппаратов на поздних этапах эксплуатации аккумуляторной батареи, когда аккумуляторы в значительной степени подвержены эффектам деградации, а заменить их не представляется возможным.
Рассмотрена проблема имитационного моделирования кондуктивных токовых помех энергопреобразующей аппаратуры. Предложенный подход позволяет выполнить расчет синфазных и дифференциальных составляющих токов посредством учета в имитационной модели паразитных параметров электрорадиоизделий и паразитных связей конструктивных элементов приборов и устройств. На примере имитационной модели одного модуля зарядно-разрядного устройства энергопреобразующей аппаратуры рассматривается расчет его паразитных параметров, представлен спектральный анализ входных и выходных токовых помех в режиме заряда.
Представлено обоснование выбранных схемных решений и описание процесса разработки GaAs-монолитно-интегральной схемы (МИС) для управляемого дискретного фазовращателя, предназначенного для работы в Ku-диапазоне частот. Данный фазовращатель может использоваться в приемопередающих модулях (ППМ) бортовой радиолокационной станции (РЛС) с активной фазированной антенной решеткой (АФАР), поскольку имеет 8 переключаемых состояний. Основное внимание в работе уделено схемотехническим решениям с интеграцией компонентов и оптимизацией характеристик фазовращателя, что обеспечивает высокую фазовую точность и низкие вносимые и возвратные потери разработанной микросхемы. Приведены результаты моделирования, подтверждающие соответствие фазовращателя заданным техническим требованиям. Дальнейшие этапы включают в себя производство и экспериментальное исследование разработанного устройства с преимуществом в количестве состояний фазового сдвига.
Представлены результаты численных расчётов, полученных при электромагнитном и механическом моделировании, а также при экспериментальном прототипировании Y- и О-образных диэлектрических СВЧ-опор из материалов Rexolite 1422 и Ultem PEI 1000. Опоры предназначены для применения в конструкциях круглых коаксиальных волноводов, в частности, в работе описано применение в коаксиальных соединителях с воздушным заполнением, сечением 1,85/0,804 мм и рабочим диапазоном частот от 0 до 67 ГГц.
Представлены результаты исследования ферритовых паст на основе литийсодержащего феррита (Li0,4Fe2,4Zn0,2O4). Проведен подбор состава связующего вещества. Наилучшее значение пористости и качества нанесения продемонстрировали два образца паст: первый образец на основе связующего вещества терпинеола и ПЭГ-400, второй образец - лишь на основе ПЭГ-400. Были проведены исследования частотных характеристик микрополосковой линии передачи с ферритовым подслоем. В результате были определены параметры ферритового слоя: диэлектрическая проницаемость феррита εr = 16, тангенс угла диэлектрических потерь tgẟ = 0,3 и магнитная проницаемость μr = 43.
Проведен анализ двух способов реализации измерения диэлектрической проницаемости на основе микрополосковой линии, когда измеряемый диэлектрик: 1) располагается над сигнальным проводником (ОМПЛ); 2) между неметаллизированным основанием (подложкой) и заземленной металлизированной поверхностью (ПМПЛ). На основе моделирования и экспериментального исследования выполнено сравнение обоих способов с оценкой их применимости для материалов различной толщины и диапазона диэлектрических проницаемостей. Для рассматриваемого диапазона материалов с малыми потерями и диэлектрической проницаемостью от 2 до 100 определено, что ОМПЛ применима для измерения диэлектрической проницаемости материалов с толщиной свыше 5 мм, в то время как ПМПЛ ввиду геометрических особенностей больше подходит для материалов с толщиной 1 мм и менее.
Приведено объяснение существования двух центров излучения комбинированной антенны в режиме ее возбуждения биполярными импульсами напряжения наносекундной длительности. Показано, что существование разнесенных в пространстве центров излучения комбинированной антенны связано, в основном, с геометрией ТЕМ-рупора, используемого в антенне в качестве излучателя электрического типа.
Разработан алгоритм вычисления временного и частотного откликов нелинейных электрических цепей (НЭЦ) на сумму гармонических воздействий по методу Базенкова на основе вольт-амперных характеристик НЭЦ. На основе алгоритма создан программный модуль и выполнена его валидация сравнением с результатами измерений. Показано, что погрешность вычислений временного отклика НЭЦ в программном модуле относительно результатов измерений не превышает 8%.
Исследуется влияние формы поперечного сечения шины электропитания (ШЭП) на её электрические и массогабаритные параметры с целью определения оптимальной формы для минимизации электромагнитных помех. Рассмотрены варианты поперечных сечений ШЭП на основе несимметричной и симметричной, а также экранированных линий передачи (ЛП). Моделировалось влияние размеров проводников и относительной диэлектрической проницаемости изолятора на погонные индуктивность ( L ), ёмкость ( C ) и волновое сопротивление ( Zв ) ШЭП. Оценены уменьшение L и рост C за счёт роста отношения ширины проводников к их толщине, а также изолятора с более высокой диэлектрической проницаемостью и меньшей толщиной. Показана предпочтительность ШЭП в виде экранированной линии передачи с прямоугольным центральным проводником.
Глубокое понимание физических явлений, происходящих в антенне или рассеивающей структуре, является ключевым для проектирования новых структур или оптимизации параметров существующих. Теория характеристических мод в сочетании с методом моментов со ступенчатыми базисными функциями является мощным инструментом для этого. Представлен комплексный анализ рассеивающих свойств проводных структур с использованием теории характеристических мод на примере крестообразной проводной структуры. Разработана алгоритмическая математическая модель с использованием теории характеристических мод в сочетании с методом моментов и алгоритмом отслеживания мод в частотном диапазоне с использованием коэффициента корреляции. Разработан программный код на ее основе в качестве эффективного вычислительного инструмента. Совпадение результатов алгоритмов, численного моделирования методом моментов и из предыдущих исследований подтверждает корректность разработанных модели, алгоритмов и программного кода.
Рассматривается редко исследуемый вопрос об электрических сигналах в цепях заземления. Он оказывается довольно сложным, когда такие цепи состоят из нескольких и разных проводников, а сигналы являются импульсными. Появление новых устройств с такими цепями требует исследования для его полноты не только их основных характеристик, но и распространения электрических сигналов в цепях заземления. Исследуется новое устройство защиты от сверхкоротких импульсов: модальный фильтр со связывающими проводниками. У него есть 4 разных проводника схемной земли, электрически соединенных параллельно на концах. Моделируются формы напряжения вдоль каждого проводника с поиском их экстремумов. Для этого используются исходный (с поиском вдоль только одного из параллельных проводников) и усовершенствованный (с поиском вдоль всех параллельных проводников) алгоритмы. Сравниваются их результаты для N -норм сигнала. Усовершенствованным алгоритмом выявлен максимум напряжения в несколько раз больше, чем исходным алгоритмом. Кроме того, наглядно показано различие максимумов в разных проводниках схемной земли и вдоль них. Подобный анализ представляется полезным для анализа перенапряжений в цепях заземления при других воздействиях, в том числе преднамеренных.
Издательство
- Издательство
- ТУСУР
- Регион
- Россия, Томск
- Почтовый адрес
- 634050, Томская обл, г Томск, пр-кт Ленина, д 40
- Юр. адрес
- 634050, Томская обл, г Томск, пр-кт Ленина, д 40
- ФИО
- Рулевский Виктор Михайлович (РЕКТОР)
- E-mail адрес
- schkarupo.anastasia@yandex.ru
- Контактный телефон
- +7 (902) 7689232
- Сайт
- https://tusur.ru/ru