ISSN 2226-1494 · EISSN 2500-0373
Языки: ru · en

НАУЧНО-ТЕХНИЧЕСКИЙ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ

Способ быстрой разметки сверхбольших данных аэросъемки (2024)

Современные нейросетевые технологии активно применяются для беспилотных летательных аппаратов.

Для решения задач детектирования, классификации и сопровождения объектов, расположенных на поверхности Земли, используются сверточные нейронные сети.

Для повышения эффективности работы сверточных нейронных сетей требуется периодическое дообучение применяемых моделей нейронных сетей на вновь поступающих полетных данных.

Такие обучающие данные необходимо дополнительно размечать.

Это приводит к увеличению общего времени подготовки дообученной модели нейронной сети.

Задача сокращения времени разметки чаще всего решается путем применения процедуры авторазметки и трекинга размеченных объектов.

Однако существующие подходы не являются эффективными при разметке сверхбольших данных аэросъемки со стандартной для беспилотных летательных аппаратов большой продолжительностью полета (более 8 ч).

Таким образом, задача поиска дополнительных способов сокращения времени разметки является актуальной.

В данной работе предложен способ быстрой разметки данных аэросъемки, собранных с видеокамер в процессе полетов беспилотных летательных аппаратов.

Метод:

Стандартная процедура разметки дополнена прореживанием сильно перекрывающихся кадров в сочетании с последующим переносом результирующей разметки на все кадры размечаемого видео.

Для каждого оставшегося после прореживания кадра вычисляется значение его потенциальной информативности (Potential Information Value, PIV), как совокупная оценка
аномалий кадра, его качества и количества автоматически детектированных объектов.

Полученные значения PIV используются для ранжирования кадров по уровню значимости.

Таким образом, оператору беспилотного летательного аппарата предоставляются в начале процедуры разметки наиболее значимые кадры.

Основные результаты:

Экспериментальное исследование эффективности предложенного подхода выполнено на подготовленных наборах данных аэросъемки, полученных с беспилотного летательного аппарата с продолжительностью съем

Modern neural network technologies are actively used for Unmanned Aerial Vehicles (UAVs). Convolutional Neural Networks (CNN), are mostly used for object detection, classification, and tracking tasks, for example, for such objects as fires, deforestations, buildings, cars, or people. However, to improve effectiveness of CNNs it is necessary to perform their fine-tuning on new flight data periodically. Such training data should be labeled, which increases total CNN finetuning time. Nowadays, the common approach to decrease labeling time is to apply auto labeling and labeled objects tracking. These approaches are not effective enough for labeling of 8 hours’ huge aerial sensed datasets that are common for long-endurance USVs. Thus, reducing data labeling time is an actual task nowadays. In this research, we propose a fast aerial data labeling pipeline especially for videos gathered by long-endurance UAVs cameras. The standard labeling pipeline was supplemented with several steps such as overlapped frames pruning, final labeling spreading over video frames. The other additional step is to calculate a Potential Information Value (PIV) for each frame as a cumulative estimation of frame anomality, frame quality, and auto-detected objects. Calculated PIVs are used than to sort out frames. As a result, an operator who labels video gets informative frames at the very beginning of the labeling process. The effectiveness of proposed approach was estimated on collected datasets of aerial sensed videos obtained by longendurance UAVs. It was shown that it is possible to decrease labeling time by 50 % in average in comparison with other modern labeling tools. The percentage of average number of labeled objects was 80 %, with them being labeled for
40 % of total pre-ranged frames. Proposed approach allows us to decrease labeling time for a new long-endurance flight video data significantly. This makes it possible to speed up neural network fine-tuning process. As a result, it became flight time that usually takes about two or t

Тип: Статья
Автор (ы): Федулин Андрей Михайлович, Волошина Наталия Викторовна
Ключевые фразы: способ быстрой разметки, беспилотный летательный аппарат, продолжительность полета БПЛА, состязательные атаки, величина потенциальной информативности кадра, PIV

Идентификаторы и классификаторы

УДК
533.6.013.622. Беспилотный полет
Текстовый фрагмент статьи