МНОГОКАНАЛЬНЫЙ ЧАТ-БОТ С МОДЕЛЬЮ КЛАССИФИКАЦИИ НАМЕРЕНИЙ ПОЛЬЗОВАТЕЛЕЙ (2023)
В статье предложена реализация простого интеллектуального помощника, работающего по модели классификации намерений. Предложен алгоритм распределенной платформы, которая определяет намерение пользователя и отвечает заготовленным ответом в один из каналов. Представлен пайплайн обработки данных и модель, работающая с полными и разреженными признаками. Обучены несколько архитектур, выбрана лучшая, с учётом метрик быстродействия и точности.
Идентификаторы и классификаторы
Разработаны модели классификации намерений, представляющие собой нейронную сеть прямого распространения. Одна модель получает признаки в формате разреженной матрицы, другая в формате плотной матрицы. Для получения разреженной вектора признаков фразы был использован алгоритм TF IDF, реализованный в виде кастомного шага пайплайн. Для выделения плотного вектора признаков фразы была использована модель sbert large nlu ru от команды СберДевайсов. Композиция этих моделей классификации является итоговой моделью. Данная модель была протестирована на тестовых данных, для неё были введены метрики, к ним относятся метрики быстродействия и метрики качества. Разработана многоканальная интеллектуальная диалоговая система, которая успешно интегрируется с различными платформами общения, такими как Telegram, VKontakte и Discord. В ходе работы был представлен абстрактный класс IBot, способствующий гибкости и универсальности при создании чат-ботов, совместимых с разными мессенджерами. Это позволяет разработчикам эффективно реализовать функционал бота, адаптируя его под особенности каждого канала связи и обеспечивая удобное и надежное взаимодействие с пользователями через предпочитаемые им платформы. В ходе работы были сформулированы задачи, разработаны модели и интегрированы каналы связи, что делает данную систему готовой к дальнейшему развитию и применению на практике.
Список литературы
-
NLP 101: как обработка естественного языка преобразует коммуникацию. URL: https://neiroseti.tech/interesnoe/nlp-101-obrabotka-estestvennogo-yazyka/(дата обращения: 13.07.2022).
-
Интеллектуальные диалоговые системы с интерфейсом на естественном языке. URL: https://habr.com/ru/articles/135420/(дата обращения: 12.08.2022).
-
Ураев Д. А. Классификация и методы создания чат-бот приложений // International scientific review of the problems and prospects of modern science and education collection of scientific articles: LXIV International correspondence scientific and practical (Boston, November, 20-21 2019). Boston: Problems of science, 2019. P. 30-33. EDN: NPECYP
-
NLP. Основы. Техники. Саморазвитие. Часть 1. URL: https://habr.com/ru/company/abbyy/blog/437008/(дата обращения: 05.08.2022).
-
Natural Language Processing: Count Vectorization with scikit-learn. URL: https://towardsdata-science.com/natural-language-processing-count-vectorization-with-scikit-learne7804269bb5e (date accessed: 25.08.2022).
-
Обучение модели естественного языка с BERT и Tensorflow. URL: https://habr.com/ru/company/sberdevices/blog/527576/(дата обращения: 19.08.2022).
-
Word2Vec Explained. URL: https://towardsdatascience.com/word2vec-explained-49c52b4ccb71 (дата обращения: 20.08.2022).
Выпуск
Другие статьи выпуска
Исследуются существующие модели теории массового обслуживания. Произведены расчеты оценки эффективности потока данных для обеспечения пропускной способности между компьютерами и сервером. Проведено тестирование и сравнительный анализ потока данных. Определены дальнейшие перспективы исследования вариантов для оценки эффективности потока данных.
С учетом возрастания размера видео и его качества, возросла необходимость повышения качества сжатия видео, что привело к возникновению новых способов сжатия видео. Также одной из причин появления новых методов является передача видео через стриминговые сервисы. Целью данного исследования является изучение способов сжатия видео и определение сфер применения данных способов. Для достижения поставленной цели был сформирован ряд задач, к которым относится, изучение структуры стримингового сервиса, анализ входной и выходной информации, изучение способов сжатия видео. Итоговым результатов данной работы является вывод, какой способ подходит к определенной сфере и выборе конечного способа для дальнейшего исследования.
Цель исследования - построить модель машинного обучения для декомпозиции текстовой формулировки компетенции. В данной статье рассматриваются методы представления компетенции как множества ключевых слов и терминов. Основное содержание исследования составляет анализ применения двух моделей: BERTopic и ARTM. Описываются основные этапы исследования: сбор и предобработка данных, обучение моделей, анализ и интерпретация результата. В заключении раскрываются преимущества и недостатки применения таких моделей, а также последующие направления исследования.
В статье описан алгоритм Кавош (Kavosh) для поиска сетевых мотивов (или статистически важных подграфов). Приведены зависимости скорости работы, полученные в результате апробации данного алгоритма на языке программирования Python. Разработанный прототип веб-приложения Motif App применим как для анализа ориентированных, так и неориентированных графов.
Рассматриваются регулярные, контекстно-свободные и контекстно-зависимые грамматики, их основные свойства и возможности применения при создании документов на основе шаблона в формате LaTeX. Описывается конкретный набор грамматик, которые могут использоваться для разбора структуры документов, включая описание таблиц, списков и блоков текста. Применение данного подхода может значительно упростить и автоматизировать процесс создания и редактирования документов.
В статье представлен метод встраивания данных, основанный на стеганографических алгоритмах, который скрывает информацию в изображениях SVG формата. Встраивание скрытых данных производится с помощью классов. Алгоритм извлечения данных происходит с помощью тэгов по атрибуту. Проведено экспериментальное исследование устойчивости предложенного алгоритма. Для эксперимента было выбрано 100 сайтов с произвольным количество изображений формата SVG. В такие изображения встроена информация разного размера, скрытая в классах дочерних svg тэгов. Предложенный алгоритм может быть использован для передачи скрытых данных в сети Интернет и встраивания цифровых водяных знаков.
Издательство
- Издательство
- ОмГТУ
- Регион
- Россия, Омск
- Почтовый адрес
- 644050, Российская Федерация, г. Омск, пр-т Мира, д. 11
- Юр. адрес
- 644050, Российская Федерация, г. Омск, пр-т Мира, д. 11
- ФИО
- Корчагин Павел Александрович (Ректор )
- E-mail адрес
- info@omgtu.ru
- Контактный телефон
- +7 (381) 2653407
- Сайт
- https://omgtu.ru/