АЛГОРИТМ РАСПОЗНАВАНИЯ НАМЕРЕНИЙ ПОЛЬЗОВАТЕЛЯ ИЗ ТЕКСТОВЫХ ЗАПРОСОВ (2023)
В работе исследованы основные подходы к распознаванию смысла предложений исходя из контекста. Распознавание смысла предложений используется для решения задачи семантического сравнения пользовательских запросов с целью найти наиболее схожий по смыслу среди имеющихся. Результаты исследования показывают, что использование алгоритмов распознавания смысла предложений позволяет сократить число запросов, которые необходимо описывать вручную, при этом сохраняя большое количество обрабатываемых запросов.
Идентификаторы и классификаторы
Архитектура модели представляет собой сиамскую нейронную сеть с тремя входами для триплета «anchor – positive – negative» (рисунок 3). К каждому из входов применяется модуль BERT, который и будет выполнять роль NLU (Natural Language Understanding). Модуль содержит в себе wordpiece-токенизатор для преобразования входных строк в BERT-совместимый формат (input_ids, input_mask, token_type_ids), а также саму обучаемую модель BERT для векторизации текста. К выходу последнего encoder-слоя модели применяется операция masked-mean-pooling, чтобы получить единый вектор для предложения. Векторизованный таким образом триплет далее применяется для вычисления softmax loss и обучения модели [5].
Список литературы
-
Чудесный мир Word Embeddings: какие они бывают и зачем нужны? URL: https://habr.com/ru/companies/ods/articles/329410/(дата обращения: 24.04.2023).
-
A Guide on Word Embeddings in NLP. URL: https://www.turing.com/kb/guide-on-word-embeddings-in-nlp (дата обращения: 24.04.2023).
-
Механизм внимания. URL: l^ps: neeir.ifnw.niwiki index.php?title.//еханизм_внимания (дата обращения: 24.04.2023).
-
How to fine-tine BERT on text classification. URL: https://neliin.con/analytics-vilhya/how-to-fine-tine-beit-on-text-classification-task-723f82786f61 (дата обращения: 14.05.2023).
-
Обучение модели естественного языка с BERT и Tensoiflow. URL: https://habi.con/ii/conpanies/sbeilevices/aiticles/527576/(дата обращения: 24.04.2023).
Выпуск
Другие статьи выпуска
Предлагается алгоритм пространственной регистрации изображений, основанный на анализе геометрического расположения меток. Он позволяет проводить поиск матрицы преобразования подобия между двумя изображениями, в том числе и из разных модальностей. Вычисления основываются на сопоставлении точек (меток), заранее отмеченных на обрабатываемых изображениях. Метки могут быть не упорядочены друг относительно друга и размечены как человеком, так и другим алгоритмом. Алгоритм может быть применён в случаях с сильно отличающимися регистрируемыми изображениями.
В работе рассматривается разработка клиент-серверного приложения для автоматизации работы заказов в продаже на примере магазина цветов. Исследуется и реализовывается алгоритм машинного обучения k-ближайшего соседа. Результатом является жизнеспособный продукт по продаже товаров цветочной продукции с использованием современного набора технологий и языков программирования.
Разработан алгоритм обнаружения отклонений в работе установок. Изучены и протестированы различные методы распознавания дефектов. Предложенный алгоритм состоит из сбора и обработки данных, анализа и разметки, создания статистических моделей и моделей машинного обучения, сравнения их качества и построения моделей прогнозирования.
Рассматривается алгоритм, целью которого является сокращение количества проводимых действий для получения требуемой звуковой дорожки. Его принцип заключается в получении сигнала путем описания правил его воспроизведения. Особенность алгоритма состоит в том, что через введенные параметры формируется функционально зависимая модель. Она получает на вход момент времени, а на выход - определенное значение. Список этих значений отражает конкретные характеристики звукового сигнала, которые были заданы пользователем.
Предлагается и исследуется модификация алгоритма циклического покоординатного спуска. Недостаток классических методов покоординатного спуска - исследуется спуск только по одной координате, что может привести к преждевременной остановке алгоритма. В предложенном модифицированном методе рассматривается движение одновременно по нескольким координатам. Проведены численные эксперименты, получены результаты решений задач, подтверждающие эффективность предложенной модификации.
Исследуются методы и этапы решения задач теории расписания. Рассматривается NP-трудная задача календарного планирования. Проведен анализ объекта и построена математическая модель, цель которой минимизировать нагрузку преподавателей. Численная реализация построенной модели целочисленного линейного программирования позволяет найти оптимальный вариант решения задачи планирования.
Издательство
- Издательство
- ОмГТУ
- Регион
- Россия, Омск
- Почтовый адрес
- 644050, Российская Федерация, г. Омск, пр-т Мира, д. 11
- Юр. адрес
- 644050, Российская Федерация, г. Омск, пр-т Мира, д. 11
- ФИО
- Корчагин Павел Александрович (Ректор )
- E-mail адрес
- info@omgtu.ru
- Контактный телефон
- +7 (381) 2653407
- Сайт
- https://omgtu.ru/