Научный архив: статьи

ПРИМЕНЕНИЕ МЕТОДОВ ГЛУБОКОГО ОБУЧЕНИЯ В ЗАДАЧАХ СЕГМЕНТАЦИИ ТЕКСТОВЫХ ИЗОБРАЖЕНИЙ (2024)

Работа посвящена решению задачи сегментации текстовых изображений, целью которой является выделение на изображении документа текстовых блоков, соответствующих колонкам, заголовкам, колонтитулам и т. д. Проводится обзор существующих методов сегментации изображений, в том числе предназначенных и для поиска и выделения на изображениях текстовых блоков. Анализируются как классические методы, так и методы, основанные на использовании искусственных нейронных сетей. Для решения поставленной задачи предлагается подход на основе свёрточных нейронных сетей и модели U-Net. Описывается метод автоматической генерации обучающих примеров для обучения нейронной сети. Рассматривается процессы настройки модели, её обучения и тестирования. Приводятся результаты численного исследования обученных моделей на реальных данных.

ОПТИМИЗАЦИЯ РАСПРЕДЕЛЕНИЯ РЕСУРСОВ И НАГРУЗКИ В ЦЕПЯХ ПОСТАВОК С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА (2024)

В статье рассматривается применение искусственного интеллекта (ИИ) для оптимизации распределения ресурсов и нагрузки в цепях поставок. В работе проведен анализ существующих методов, сфокусированных на задачах оптимизации, основной акцент сделан на алгоритмах искусственного интеллекта. Были описаны и проанализированы генетические алгоритмы, муравьиные алгоритмы и алгоритмы имитации отжига. Результаты анализа показали, что генетические алгоритмы обладают способностью находить глобальные оптимальные решения, однако их использование требует больших вычислительных ресурсов и времени. Муравьиные алгоритмы, в свою очередь, эффективно решают задачу нахождения локальных оптимумов, при этом обладая низкой вычислительной сложностью. Алгоритмы имитации отжига позволяют быстро находить решения, однако они сопровождаются вероятностью попадания в локальные минимумы. Данная статья показывает, насколько применение алгоритмов искусственного интеллекта позволяет улучшить решение задач оптимизации в цепях поставок.

ОПТИМИЗАЦИЯ УПРАВЛЕНИЯ СКЛАДСКИМИ ОПЕРАЦИЯМИ С ПОМОЩЬЮ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ НА БАЗЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА (2024)

Данная статья посвящена проблеме оптимизации управления складскими операциями с использованием системы поддержки принятия решений на основе искусственного интеллекта. Складские операции являются важной составляющей логистической цепи снабжения, и эффективное управление ими может привести к значительному повышению производительности и снижению издержек. В работе представлен анализ, в рамках которого рассматривается применение искусственного интеллекта для оптимизации процессов управления складскими операциями. Предложено использовать систему поддержки принятия решений, основанную на методах искусственного интеллекта, таких как машинное обучение, алгоритмы оптимизации и экспертные системы.

Cравнительный анализ методологий и технологий машинного обучения (2025)

Статья посвящена сравнительному анализу трех ключевых парадигм машинного обучения (МО): обучение с учителем, обучение без учителя, обучение с подкреплением – наряду с оценкой популярных фреймворков МО, таких как TensorFlow, PyTorch и Scikit-learn. В исследовании были изучены основные различия, преимущества и ограничения подходов МО, особое внимание уделялось таким факторам, как: вычислительные затраты, масштабируемость и простота реализации. Рассмотрены аспекты интерпретируемости моделей МО и проанализированы вычислительные ресурсы, необходимые для их работы, включая нагрузку на центральный процессор и оперативную память. Результаты дают необходимую информацию о том, как различные методологии и технологии МО формируют реальные приложения и влияют на практическое принятие решений в системах, управляемых искусственным интеллектом.

СРАВНИТЕЛЬНЫЙ АНАЛИЗ НЕЙРОСЕТЕВЫХ АРХИТЕКТУР В ЗАДАЧЕ ОБНАРУЖЕНИЯ И РАЗЛИЧЕНИЯ СИГНАЛОВ ЦЕЛИ И УВОДЯЩЕЙ ПОМЕХИ (2024)

Рассмотрено применение аппарата искусственных нейронных сетей в задаче обнаружения и разрешения сигналов цели и уводящей помехи. Показано, что данную задачу в контексте машинного обучения можно свести к задаче обработки временных последовательностей. Приведены результаты обучения и сопоставительного анализа ряда соответствующих нейросетевых архитектур.

Издание: ТРУДЫ МАИ
Выпуск: № 134 (2024)
Автор(ы): КОВАЛЬ Н. А.
УСТОЙЧИВАЯ К ШУМУ В РАЗМЕТКЕ СВЕРТОЧНАЯ НЕЙРОННАЯ СЕТЬ В ЗАДАЧЕ СЕГМЕНТАЦИИ ГЛИОМ НА МРТ ИЗОБРАЖЕНИЯХ (2020)

Сегментация медицинских изображений – одна из важнейших задач лучевой диагностики и терапии. Современные подходы к решению этой задачи основаны на глубоком обучении и показывают высокое качество при обучении на стандартизированных и специально собранных данных. Однако при работе с реальными клиническими изображениями ситуация кардинально меняется из-за принципиально более сложного устройства данных. В задаче сегментации опухолей головного мозга для планирования лучевой терапии размеры и интенсивности изображений существенно варьируются в зависимости от настроек аппарата магнитно-резонансной томографии; отмечается неоднозначность трактовки разными экспертами выявляемых на томограммах изменений; наконец, контуры мишени не всегда соответствуют изображению магнитно-резонансной томографии вследствие использования дополнительных модальностей при планировании облучения. В силу указанных причин сформированные выборки содержат большое количество шумных аннотаций. Мы предлагаем устойчивый алгоритм обучения, основанный на модификации традиционной архитектуры сверточной нейронной сети при помощи модуля для обучения весов, используемых в результирующей функции потерь (взвешенной перекрестной энтропии). Наша модель успешно борется с наличием шума в разметке и значительно уменьшает эффект высокой гетерогенности данных, повышая качество сегментации на 38%.

ПРИМЕНЕНИЕ КОМБИНИРОВАННЫХ ВЕКТОРНЫХ ПРЕДСТАВЛЕНИЙ ПРИ РЕШЕНИИ ЗАДАЧИ КЛАССИФИКАЦИИ НАМЕРЕНИЙ ПОЛЬЗОВАТЕЛЕЙ ИНТЕЛЛЕКТУАЛЬНОЙ ДИАЛОГОВОЙ СИСТЕМЫ (2022)

В работе приведен краткий теоретический обзор существующих подходов к решению задачи классификации намерений пользователей на основе текстовых сообщений. Предложен классификатор на основе текстового трансформера. Рассмотрены процессы обучения и использования модели. В рамках эксперимента обучено несколько демонстрационных вариантов классификатора для корпоративной диалоговой системы. Приведены показатели качества моделей в виде совокупности значений основных метрик и визуализаций, применяемых при оценке классификаторов

ФОРМИРОВАНИЕ БАЗЫ ДАННЫХ ДЛЯ ГЛУБОКОГО ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ (2022)

В работе представлен способ применения статистической математической модели в процессе генерации базы данных для обучения искусственной нейронной сети. Исследование проводилось на примере прогнозирования физико-химических свойств модели многокомпонентной смеси дизельного топлива и водородсодержащего газа. В результате получена нейронная сеть, которая определяет искомые величины с ошибкой 0,2%. Это позволит использовать нейронную сеть в динамических системах оценки загрязнений технологических аппаратов со стороны исследуемой углеводородной смеси без использования сторонних программных продуктов.

МНОГОКАНАЛЬНЫЙ ЧАТ-БОТ С МОДЕЛЬЮ КЛАССИФИКАЦИИ НАМЕРЕНИЙ ПОЛЬЗОВАТЕЛЕЙ (2023)

В статье предложена реализация простого интеллектуального помощника, работающего по модели классификации намерений. Предложен алгоритм распределенной платформы, которая определяет намерение пользователя и отвечает заготовленным ответом в один из каналов. Представлен пайплайн обработки данных и модель, работающая с полными и разреженными признаками. Обучены несколько архитектур, выбрана лучшая, с учётом метрик быстродействия и точности.

РАЗРАБОТКА БИБЛИОТЕКИ ДЛЯ РЕШЕНИЯ ВАРИАЦИОННЫХ НЕРАВЕНСТВ НЕЙРОННЫМИ СЕТЯМИ (2024)

В статье исследуется применение нейронных сетей для решения вариационных неравенств. Проведены эксперименты, в рамках которых разработаны архитектуры нейронных сетей разной сложности. Эти архитектуры успешно решают широкий спектр задач, включая системы уравнений и неравенств, а также вариационные неравенства. Более быстрые и точные методы решения вариационных неравенств могут существенно повысить эффективность вычислительных процессов и оптимизацию систем. Результаты экспериментов свидетельствуют о перспективности использования нейронных сетей в этой области и могут послужить основой для дальнейших исследований и разработок.

Применение технологий компьютерного зрения для контроля доступности хлебобулочных изделий на полках в режиме реального времени (2024)

Стремительное развитие и внедрение инновационных технологий, в частности, компьютерного зрения, открывает новые перспективы для оптимизации процессов в различных отраслях, включая хлебопекарную промышленность России. Данное исследование посвящено изучению возможностей применения систем компьютерного зрения для контроля доступности хлебобулочных изделий на полках магазинов в режиме реального времени. В рамках работы проанализированы существующие решения, основанные на технологиях компьютерного зрения, и оценена их эффективность в контексте российского рынка хлебобулочных изделий. Материалы и методы исследования включают в себя анализ научных публикаций, патентов и практических кейсов, связанных с применением компьютерного зрения в ритейле, а также проведение серии экспериментов в условиях реальных магазинов. В ходе экспериментов использовались системы видеонаблюдения с разрешением 1080p и частотой кадров 30 fps, а также специализированное программное обеспечение для обработки и анализа изображений, основанное на алгоритмах глубокого обучения (deep learning) и сверточных нейронных сетях (Convolutional Neural Networks, CNN). Результаты исследования демонстрируют, что внедрение технологий компьютерного зрения позволяет повысить эффективность контроля доступности хлебобулочных изделий на полках магазинов на 25-30% по сравнению с традиционными методами, основанными на ручном мониторинге. Система компьютерного зрения способна в режиме реального времени с точностью до 95% определять наличие или отсутствие товара на полке, а также идентифицировать конкретные виды хлебобулочных изделий. Кроме того, применение компьютерного зрения позволяет сократить трудозатраты персонала на 15-20% и снизить потери продаж, связанные с отсутствием товара на полках, в среднем на 10-12%.

ПРИМЕНЕНИЕ ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ИРОНИИ В РУССКОЯЗЫЧНЫХ ТЕКСТАХ (2024)

В работе исследуются автоматические методы классификации русскоязычных предложений на два класса: содержащие и не содержащие ироничный посыл. Рассматриваемые методы могут быть разделены на три категории: классификаторы на основе эмбеддингов языковых моделей, классификаторы с использованием информации о тональности и классификаторы с обучением эмбеддингов обнаружению иронии. Составными элементами классификаторов являются нейронные сети, такие как BERT, RoBERTa, BiLSTM, CNN, а также механизм внимания и полносвязные слои. Эксперименты по обнаружению иронии проводились с использованием двух корпусов русскоязычных предложений: первый корпус составлен из публицистических текстов из открытого корпуса OpenCorpora, второй корпус является расширением первого и дополнен ироничными предложениями с ресурса Wiktionary. Лучшие результаты продемонстрировала группа классификаторов на основе чистых эмбеддингов языковых моделей с максимальным значением F-меры 0.84, достигнутым связкой из RoBERTa, BiLSTM, механизма внимания и пары полносвязных слоев в ходе экспериментов на расширенном корпусе. В целом использование расширенного корпуса давало результаты на 2-5% выше результатов на базовом корпусе. Достигнутые результаты являются лучшими для рассматриваемой задачи в случае русского языка и сравнимы с лучшими для английского.