ISSN 2305-9052 · EISSN 2410-7034
Языки: ru · en

ВЕСТНИК ЮЖНО-УРАЛЬСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА. СЕРИЯ: ВЫЧИСЛИТЕЛЬНАЯ МАТЕМАТИКА И ИНФОРМАТИКА

МЕТОД СОЗДАНИЯ СТРУКТУРНЫХ МОДЕЛЕЙ ТЕКСТОВЫХ ДОКУМЕНТОВ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ (2023)

В статье описываются современные нейросетевые модели на основе BERT и рассматривается их применение для задач обработки естественного языка (NLP), таких как ответы на вопросы и распознавание именованных сущностей. В статье представлен метод решения задачи автоматического создания структурныхмоделей текстовых документов. Предлагаемый метод является гибридным и основан на совместном использовании нескольких моделей NLP. Метод строит структурную модель документа, извлекая предложения,соответствующие различным аспектам документа. Извлечение информации осуществляется с использованием вопросно-ответной модели BERT с вопросами, подготовленными отдельно для каждого аспекта.Ответы фильтруются с помощью модели распознавания именованных сущностей BERT и используютсядля формирования содержимого каждого поля структурной модели. В статье предложены два алгоритмаформирования содержимого поля - алгоритм выбора исключающего ответа и алгоритм формированияобобщающего ответа, которые используются для коротких и объемных полей соответственно. В статье также описывается программная реализация предлагаемого метода и обсуждаются результаты экспериментов,проведенных для оценки качества метода.

Тип: Статья
Автор (ы): Березкин Дмитрий Валерьевич, Козлов Илья Андреевич, Мартынюк Полина Антоновна, Панфилкин А. М.
Ключевые фразы: извлечение информации, РАСПОЗНАВАНИЕ ИМЕНОВАННЫХ СУЩНОСТЕЙ, ВОПРОСНО-ОТВЕТНАЯ СИСТЕМА, INFORMATION EXTRACTION, NAMED ENTITY RECOGNITION, QUESTION-ANSWERING SYSTEM

Идентификаторы и классификаторы

УДК
004.89. Прикладные системы искусственного интеллекта. Интеллектуальные системы, обладающие знаниями
eLIBRARY ID
50396390
Текстовый фрагмент статьи