ISSN 2072-9502 · EISSN 2224-9761
Язык: ru

ВЕСТНИК АСТРАХАНСКОГО ГОСУДАРСТВЕННОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА. СЕРИЯ: УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА

АНАЛИЗ АЛГОРИТМОВ И РЕШЕНИЙ ДЛЯ АВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ ПОДВОДОК НОВОСТНЫХ СТАТЕЙ В СОЦСЕТЯХ С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА (2023)

При публикации статей в социальных сетях редакциям новостных порталов необходимо сформировать краткий реферат каждой статьи, затратив на это минимум времени. Оперативному и одновременному размещению публикации на всех зарегистрированных ресурсах способствует автоматическая генерация подводок. Предлагается использование алгоритмов искусственного интеллекта, обученных на корпусах русских текстов. Известны три подхода к реферированию текста для автоматизированного формирования подводок статей: экстрактивный, абстрактивный и комбинированный. Проводится сравнительный анализ методов экстрактивного и абстрактивного подходов в рамках решения задачи автоматической генерации подводок с помощью применения нейросетевых моделей машинного обучения. Проанализированы различные этапы экстрактивного реферирования с помощью как простых, так и более сложных методов: LexRank, TextRank и на основе Deep Learning. Путем сравнения выбраны абстрактивные модели как наиболее подходящие для выполнения суммаризации новостных статей, на основе модификации модели BERT. Более сложные генерирующие тексты обрабатывают тексты параллельно, что ускоряет обработку, но требует предобучения на больших корпусах новостных документов. При использовании абстрактивных моделей Pointer General Network и MBART сокращается время обработки информации, повышается эффективность работы.

Тип: Статья
Автор (ы): Егунова Алла Ивановна, Комаров Роман Сергеевич, Вечканова Ю. С., Сидоров Дмитрий Петрович, Шибайкин Сергей Дмитриевич, Никулин Владимир Валерьевич, Егунова Ольга Игоревна
Ключевые фразы: СУММАРИЗАЦИЯ, РЕФЕРИРОВАНИЕ, ВЕКТОР, ТОКЕН, КОДИРОВАНИЕ, ДЕКОДИРОВАНИЕ, ГЕНЕРАЦИЯ

Идентификаторы и классификаторы

УДК
004.912. Обработка текста
eLIBRARY ID
50167294
Текстовый фрагмент статьи