РАСШИРЕНИЕ ПРИЗНАКОВОГО ПРОСТРАНСТВА В ЗАДАЧЕ ПОИСКА И РАСПОЗНАВАНИЯ МАЛОРАЗМЕРНЫХ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ (2024)

Одним из актуальных направлений при создании систем раннего обнаружения объектов является разработка алгоритмов поиска и распознавания малоразмерных объектов на изображениях. В задаче раннего обнаружения приходится распознавать объекты на дальних расстояниях от места их фиксации камерой. Образ на изображении таких объектов представлен малой компактной группой пикселей, которая претерпевает пространственные и яркостные изменения от кадра к кадру. Для успешного решения этой задачи целевые объекты реального мира должны иметь большие физические размеры. Кроме физических размеров объекта на образ объекта на изображении влияют большое количество факторов: разрешение матрицы камеры, фокусное расстояние объектива, светочувствительность матрицы и др. Вектор решения такой задачи направлен в сторону сверточных нейронных сетей. Однако, даже у передовых архитектур сверточных нейронных сетей поиск и распознавание малоразмерных объектов на изображениях вызывает трудности. Эта проблема напрямую связана с эффектом переобучения модели нейронной сети. Переобучение модели нейронной сети можно оценить на основе анализа кривых обучения. Для снижения вероятности переобучения применяют специальные методы, которые объединяет термин регуляризация. Однако, в распознавании малоразмерных объектов существующих методов регуляризации бывает недостаточно. В работе произведено исследование разработанного алгоритма предварительной обработки последовательности видеокадров, увеличивающего исходное пространство признаков новым независимым признаком движения в кадре. Алгоритм предварительной обработки основан на пространственно-временной фильтрации последовательности видеокадров, применение которого распространяется на широкий спектр архитектур сверточных нейронных сетей. Для исследования характеристик точности и распознавания сверточных нейронных сетей сформированы датасеты изображений в градациях серого и изображений с признаком движения на основе среды разработки 3D графики Unreal Engine 5. В работе приведен критерий малоразмерности объектов на изображениях. Произведено обучение и оценка характеристик точности тестовой модели сверточной нейронной сети и анализ динамики кривых обучения тестовой модели. Показано положительное влияние предложенного алгоритма предварительной обработки последовательности видеокадров на интегральную точность обнаружения малоразмерных объектов.

Издание: ИЗВЕСТИЯ ЮФУ. ТЕХНИЧЕСКИЕ НАУКИ
Выпуск: № 1 (2024)
Автор(ы): Ковалев Владислав Владимиров, Сергеев Николай Евгеньевич
Сохранить в закладках