Архив статей журнала
Работа посвящена проблеме повышения эффективности масочного автоэнкодера за счет разработки стратегии маскирования изображений, которая учитывала бы расположение объектов на изображении и позволяла бы скрыть как можно меньше семантически важной информации. В статье представлен обзор существующих методов маскирования изображений, включая стратегии как с учетом, так и без учета структуры изображения. Предложена стратегия наложения масок на основе алгоритма поиска объектов, анализирующего элементарные характеристики фрагментов изображений. Исследование проводится на примере масочного автоэнкодера с ViT в качестве энкодера. Сравнивается эффективность обучения энкодера с использованием предложенной стратегии и с использованием стратегии случайного маскирования изображений.
В работе рассматривается один из этапов определения кода товарной номенклатуры внешнеэкономической деятельности для товаров, входящих в целевую группу «обувь», состоящий в анализе изображений товарных позиций, присутствующих в сопроводительных документах. Приведено обоснование применения сверточных нейронных сетей для классификации изображений. Рассмотрены возможные подходы к построению специализированных нейросетевых классификаторов. Проведен сравнительный анализ эффективности подходов, основанных на дообучении существующих классификаторов (transfer learning) и на построении сверточных сетей, обученных только на размеченных данных выбранного товарного ассортимента. Исследованы вопросы получения обучающей выборки путем парсинга специализированных сайтов и получения элементов выборки с помощью систем искусственного интеллекта, специализирующихся на генерации изображений по запросу.
В работе проведен анализ текстов описаний товарных позиций ТН ВЭД для обуви, определены признаки, влияющие на классификацию. Предложена систематизация признаков, доступных для визуального распознавания и формализации из документации. Приведены возможности использования методов искусственного интеллекта для решения задач классификации, приведен опыт построения экспертной системы.
Семантическая сегментация - операция в компьютерном зрении, заключающаяся в классификации и попиксельной локализации объектов на цифровом изображении. Данная статья содержит в себе обзор существующих модификаций классической архитектуры сверточной нейронной сети, направленных на решение проблемы искажения информации с исходного изображения. Проведено сравнение эффективности рассмотренных моделей в условиях бинарной и множественной семантической сегментации. Статья может быть полезной для ML/DL-разработчиков, желающих изучить проблематику сегментации изображений в рамках своей предметной области.