Архив статей

ПРИМЕНЕНИЕ КОМБИНИРОВАННЫХ ВЕКТОРНЫХ ПРЕДСТАВЛЕНИЙ ПРИ РЕШЕНИИ ЗАДАЧИ КЛАССИФИКАЦИИ НАМЕРЕНИЙ ПОЛЬЗОВАТЕЛЕЙ ИНТЕЛЛЕКТУАЛЬНОЙ ДИАЛОГОВОЙ СИСТЕМЫ (2022)

Выпуск: Т. 9 № 4 (2022)

Авторы: Гуненков М. Ю., Канева О. Н.

В работе приведен краткий теоретический обзор существующих подходов к решению задачи классификации намерений пользователей на основе текстовых сообщений. Предложен классификатор на основе текстового трансформера. Рассмотрены процессы обучения и использования модели. В рамках эксперимента обучено несколько демонстрационных вариантов классификатора для корпоративной диалоговой системы. Приведены показатели качества моделей в виде совокупности значений основных метрик и визуализаций, применяемых при оценке классификаторов

Сохранить в закладках

АЛГОРИТМ РАСПОЗНАВАНИЯ НАМЕРЕНИЙ ПОЛЬЗОВАТЕЛЯ ИЗ ТЕКСТОВЫХ ЗАПРОСОВ (2023)

Выпуск: Т. 10 № 4 (2023)

Авторы: Михеев С. Е., Тюменцев Е. А.

В работе исследованы основные подходы к распознаванию смысла предложений исходя из контекста. Распознавание смысла предложений используется для решения задачи семантического сравнения пользовательских запросов с целью найти наиболее схожий по смыслу среди имеющихся. Результаты исследования показывают, что использование алгоритмов распознавания смысла предложений позволяет сократить число запросов, которые необходимо описывать вручную, при этом сохраняя большое количество обрабатываемых запросов.

Сохранить в закладках

ИЗВЛЕЧЕНИЕ МАТЕМАТИЧЕСКИХ ТЕРМИНОВ ИЗ ОБРАЗОВАТЕЛЬНЫХ МАТЕРИАЛОВ ПРИ ПОМОЩИ МЕТОДОВ ВЫЧИСЛИТЕЛЬНОЙ ЛИНГВИСТИКИ (2023)

Выпуск: Т. 10 № 3 (2023)

Авторы: Тюменцев Е. А., Щепелев Н. Ю.

Для определения и извлечения сущностей и связей используются методы анализа текста, такие как метод обнаружения именованных сущностей и метод классификации ролей. Для повышения точности и эффективности извлечения применяются такие методы, как метод опорных векторов и метод условных случайных полей. Предложенный подход демонстрирует многообещающие результаты в точной и эффективной разметке образовательных материалов на математические термины.

Сохранить в закладках

РЕАЛИЗАЦИЯ АВТОМАТИЧЕСКОГО РЕФЕРИРОВАНИЯ СОДЕРЖИМОГО ВЕБ-СТРАНИЦЫ (2023)

Выпуск: Т. 10 № 3 (2023)

Авторы: Дробов Д. А., Морарь Е. В.

Исследуется задача разработки краткого описания текста веб-страницы. Краткое описание создано за счет использования архитектуры машинного обучения Transformer, которая в предварительно обученном состоянии позволяет суммаризировать текст. По ходу реализации исследована модель генерирующего реферирования текста. Исследованы возможности модели, за счет каких особенностей она способна обрабатывать и аннотировать текст. Проанализированы результаты работы модели и сравнены с итогами работы других моделей реферирования, благодаря чему объясняется выбор изученной модели.

Сохранить в закладках

РАЗРАБОТКА ИНСТРУМЕНТАРИЯ ДЛЯ МОДЕРАЦИИ КОММЕНТАРИЕВ НА ОСНОВЕ АНАЛИЗА ТОНАЛЬНОСТИ (2023)

Выпуск: Т. 10 № 2 (2023)

Авторы: Рыбакова Е. И., Шарун И. В.

Рассматривается задача модерации комментариев с фильтрацией негативного контента. Используется фреймворк PySpark для анализа тональности комментариев на основе библиотеки Apache Spark. Алгоритм считывает текст комментария и определяет его эмоциональный окрас. Инструментарий может использоваться на образовательных веб-сервисах, где можно фильтровать негативные комментарии и предотвращать их появление на сайте, что в свою очередь улучшает качество контента и безопасность для пользователей.

Сохранить в закладках

ГЛУБОКОЕ ОБУЧЕНИЕ МОДЕЛИ ДЛЯ РАСПОЗНАВАНИЯ ИМЕНОВАННЫХ СУЩНОСТЕЙ В УСЛОВИЯХ КРИТИЧЕСКОГО ДИСБАЛАНСА КЛАССОВ (2023)

Выпуск: Т. 10 № 2 (2023)

Авторы: Гуненков М. Ю., Канева О. Н.

В работе проведен анализ существующих методов извлечения именованных сущностей из текстов на русском языке. Сформулированы эквивалентная задача классификации и правила разметки именованных сущностей. Предложены подходы, позволяющие повысить эксплуатационные качества классификаторов. Проведен численный эксперимент, в ходе которого обучено несколько моделей. Продемонстрированы преимущества использования предложенных подходов по отдельности и в совокупности.

Сохранить в закладках

ПРИМЕНЕНИЕ ТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ ДЛЯ ДЕКОМПОЗИЦИИ ТЕКСТОВОЙ ФОРМУЛИРОВКИ ОБРАЗОВАТЕЛЬНОЙ КОМПЕТЕНЦИИ (2023)

Выпуск: Т. 10 № 1 (2023)

Авторы: Тверской О. Ю., Канева О. Н.

Цель исследования - построить модель машинного обучения для декомпозиции текстовой формулировки компетенции. В данной статье рассматриваются методы представления компетенции как множества ключевых слов и терминов. Основное содержание исследования составляет анализ применения двух моделей: BERTopic и ARTM. Описываются основные этапы исследования: сбор и предобработка данных, обучение моделей, анализ и интерпретация результата. В заключении раскрываются преимущества и недостатки применения таких моделей, а также последующие направления исследования.

Сохранить в закладках

МНОГОКАНАЛЬНЫЙ ЧАТ-БОТ С МОДЕЛЬЮ КЛАССИФИКАЦИИ НАМЕРЕНИЙ ПОЛЬЗОВАТЕЛЕЙ (2023)

Выпуск: Т. 10 № 1 (2023)

Авторы: Нелин М. А., Крумина К. В., Лонский Д. О.

В статье предложена реализация простого интеллектуального помощника, работающего по модели классификации намерений. Предложен алгоритм распределенной платформы, которая определяет намерение пользователя и отвечает заготовленным ответом в один из каналов. Представлен пайплайн обработки данных и модель, работающая с полными и разреженными признаками. Обучены несколько архитектур, выбрана лучшая, с учётом метрик быстродействия и точности.

Сохранить в закладках

АЛГОРИТМ ФОРМИРОВАНИЯ КОМПЕТЕНТНОСТНОГО ПРОФИЛЯ СТУДЕНТА С ПОМОЩЬЮ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ (2024)

Выпуск: Т. 11 № 1 (2024)

Авторы: Катюшкина А. В., Шарун И. В.

Задача извлечения структурированных данных из слабоструктурированного текстового представления информации является трудоёмкой, но актуальной. В статье рассмотрена задача структурирования данных для формирования дескрипторной модели студента с его компетенциями. Разработано решение, которое показывает хорошие результаты при условии, что в наличии есть большое количество данных для обучения. Данное решение можно переработать и распространить на другие области, например, проектную деятельность.

Сохранить в закладках

Все права на тексты и товарные знаки принадлежат их законным владельцам. Подробнее...

Сайт https://scinetwork.ru (далее – сайт) работает по принципу агрегатора – собирает и структурирует информацию из публичных источников в сети Интернет, то есть передает полнотекстовую информацию о товарных знаках в том виде, в котором она содержится в открытом доступе.

Сайт и администрация сайта не используют отображаемые на сайте товарные знаки в коммерческих и рекламных целях, не декларируют своего участия в процессе их государственной регистрации, не заявляют о своих исключительных правах на товарные знаки, а также не гарантируют точность, полноту и достоверность информации.

Все права на товарные знаки принадлежат их законным владельцам!

Сайт носит исключительно информационный характер, и предоставляемые им сведения являются открытыми публичными данными.

Администрация сайта не несет ответственность за какие бы то ни было убытки, возникающие в результате доступа и использования сайта.

Спасибо, понятно.

Ключ. фраза: Обработка естественного языка

Рубрика:

Наведите камеру на QR-код, чтобы открыть моб. версию журнала.

Главный редактор

Зыкина Анна Владимировна