Языки: ru · en

Статья: Сравнительный анализ архитектур backbone для инстанс-сегментации объектов на аэрофотоснимках с использованием Mask R-CN (2025)

Читать
Читать онлайн

В работе проведено сравнительное исследование моделей Mask R-CNN с различными предобученными backbone-архитектурами для реализации инстанс-сегментации объектов недвижимости на аэрофотоснимках. Модели дообучались на специализированном наборе данных ППК «Роскадастр». Анализ точности детектирования ограничивающих рамок и масок сегментации объектов выявил предпочтительные архитектуры — трансформеры Swin (Swin-S и Swin-T) и свёрточная сеть ConvNeXt-T. Высокая точность этих моделей объясняется их способностью учитывать глобальные контекстные зависимости между элементами изображения. Результаты исследования позволяют сформулировать следующие рекомендации по выбору архитектуры backbone: для систем мониторинга в реальном времени, где критична скорость работы, целесообразно применение легковесных моделей (EfficientNetB3, ConvNeXt-T, Swin-T), для offline задач, требующих максимальной точности (таких как картирование объектов недвижимости), рекомендована крупномасштабная модель Swin-S.

Ключевые фразы: инстанс-сегментация, backbone, mask r-cnn, resnet, densenet, efficientnet, convnext, swin
Автор (ы): Винокуров Игорь Викторович, Ильин Андрей Иванович, Кузнецов Иван Романович, Фролова Дарья Александровна
Журнал: Программные системы: теория и приложения

Предпросмотр статьи

Идентификаторы и классификаторы

УДК
004.89. Прикладные системы искусственного интеллекта. Интеллектуальные системы, обладающие знаниями
Для цитирования:
ВИНОКУРОВ И. В., ИЛЬИН А. И., КУЗНЕЦОВ И. Р., ФРОЛОВА Д. А. СРАВНИТЕЛЬНЫЙ АНАЛИЗ АРХИТЕКТУР BACKBONE ДЛЯ ИНСТАНС-СЕГМЕНТАЦИИ ОБЪЕКТОВ НА АЭРОФОТОСНИМКАХ С ИСПОЛЬЗОВАНИЕМ MASK R-CN
Текстовый фрагмент статьи