Архив статей журнала
В данной обзорной статье представлен анализ основных направлений исследований по теме классификация объектов на изображении методами компьютерного зрения. Методы компьютерного зрения позволяют автоматизировать процесс выделения семантического смысла из изображений. Под классификацией объектов на изображении понимается локализация объектов, интересующих исследователя, и соотнесение их с определенным классом. Актуальность данной темы закреплена в государственной программе: национальная стратегия развития искусственного интеллекта на период до 2030 года. Так же в статье приведена статистика публикационной активности научных авторов по теме «компьютерное зрение», которая показывает актуальность данного направления. Работа имеет следующую структуру: во введении статьи приведены различные статистики, отражающие актуальность темы. Далее приведен обзор научных исследований посвященных решению прикладных аспектов задачи классификации объектов на изображении в различных областях человеческой деятельности. Основной упор сделан на следующие прикладные области: медицина, промышленность, безопасность, транспорт и военное дело. Далее приведен анализ методов, которые используются для решения задачи классификации объектов на изображении. Автор выделяет две группы методов: классические и нейросетевые методы. Под классическими алгоритмами и методами понимается подход к решению задачи классификации объектов на изображении, в котором не используются искусственные нейронные сети. Выводы. Тема исследования на сегодня является актуальной, что подтверждено статистикой и государственными программами. Для классических методов выявлены следующие недостатки: для каждой новой прикладной задачи требуется построение алгоритма ее решения, трудоемкость выделения значимых признаков и неустойчивость при работе с определенными видами данных. Для нейросетевых методов основным недостатком является зависимость конечной модели от качества набора данных, на котором она обучается.
Статья продолжает серию работ, посвященных тематике интеллектуального анализа данных с применением методов вывода на табличных ограничениях. Ранее были представлены авторские методы кластеризации, выявления паттернов требуемого вида, поиска ассоциативных правил. Разработанные методы относятся к методам объяснимого (интерпретируемого) искусственного интеллекта. Недостатки большинства существующих методов интеллектуального анализа данных связаны, в первую очередь, с трудностями гибкого учета и анализа знаний экспертов предметной области, пользовательских ограничений. Обычно для учета каждого типа подобных ограничений требуется довольно трудоемкая модификация базовых методов обучения. В статье развивается подход на основе парадигмы программирования в ограничениях, который свободен от упомянутых недостатков и позволяет гибко организовывать учет и анализ дополнительных условий задачи интеллектуального анализа данных без принципиального изменения схемы её решения. Оригинальность авторского подхода состоит в том, что для представления обучающей выборки предложено использовать особый тип табличных ограничений - сжатые таблицы D-типа, а сами задачи интеллектуального анализа данных предложено решать как задачи удовлетворения табличных ограничений с применением оригинального способа ветвления дерева поиска и авторских правил редукции сжатых таблиц. В представленной работе на примере решения задач бинарной классификации впервые рассматриваются возможности применения авторского подхода для моделирования рассуждений типа ДСМ. В статье рассматривается случай, когда свойства объектов являются атомарными, не имеют внутренней структуры. Задачу генерации ДСМ-гипотез предлагается сводить к поиску частых замкнутых паттернов, причем каждый из паттернов не должен входить как фрагмент во множество контрпримеров. В рамках предлагаемого в статье подхода добавление в задачу дополнительных типов ограничений не только не снижает производительность методов их решения, но и способствует более глубокой редукции пространства поиска за счет применения специализированных методов логического вывода для каждого из типов ограничений.
В статье представлены результаты разработки нейроиммунного метода сжатия данных, предназначенного для дальнейшей апробации в системе анализа инцидентов информационной безопасности. Осуществлён анализ классических методов и методов машинного обучения, применяемых для компрессии данных с потерями и без. Рассмотрены варианты архитектур нейронных сетей для обеспечения компрессии векторов. Предложен метод комбинирования гибридной искусственной иммунной системы со свёрточной нейронной сетью архитектуры Bottleneck-type путём применения разработанных в рамках предыдущих исследований интеллектуальных методов оптимизации и классификации, в том числе включающих в себя модифицированный генетический алгоритм дуэлей. Проведена оценка эффективности полученного гибридного подхода компрессии с классической свёрточной нейронной сетью и многослойной нейронной сетью прямого распространения Bottleneck-type. В качестве критериев эффективности были выбраны степень сжатия, точность декомпрессии данных. Для проведения сравнительного анализа рассмотренных методов был разработан программный комплекс, реализующий модуль сбора и хранения данных в системе анализа инцидентов информационной безопасности, предназначенный для дальнейшего применения при подготовке данных в задаче анализа и корреляции событий информационной безопасности. В результате исследования в качестве наиболее эффективного подхода компрессии данных был предложен разработанный нейроиммунный метод сжатия, показавший при сравнительном анализе с составляющими его алгоритмами лучшую точность декомпрессии при аналогичных степенях сжатия. Предложенный метод может быть адаптирован для использования в системах сжатия и хранения не только текста, но и видеоинформации, позволяет повысить качество распознавания системой анализа инцидентов при классификации образов событий безопасности.