ISSN 2226-1494 · EISSN 2500-0373
Языки: ru · en

НАУЧНО-ТЕХНИЧЕСКИЙ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ

Архив статей журнала

Цензурирование обучающих выборок с использованием регуляризации отношений связанности объектов классов (2024)
Выпуск: №2, Том 24 (2024)
Авторы: Игнатьев Николай Александрович, Турсунмуротов Даврбек Худаёрович

Рассмотрено цензурирование обучающих выборок с учетом специфики реализации алгоритмов метода ближайшего соседа.

Процесс цензурирования связан с использованием множества граничных объектов классов по заданной метрике с целью: поиска и удаления шумовых объектов; анализа кластерной структуры обучающей выборки по отношению связанности.

Исследуются специальные условия удаления шумовых объектов и формирования базы прецедентов для обучения алгоритмов.

Распознавание объектов по такой базе должно обеспечивать более высокую точность с минимальными затратами вычислительных ресурсов относительно исходной выборки.

Метод: Разработаны необходимые и достаточные условия для отбора шумовых объектов из множества граничных. Необходимое условие принадлежности граничного объекта к множеству шумовых задается в виде ограничения (порога) на отношение расстояний до ближайшего объекта из своего класса и его дополнения.

Поиск минимального покрытия обучающей выборки эталонами производится на основе анализа кластерной структуры. Эталоны представлены объектами выборки.

Структура отношений связанности объектов по системе гипершаров используется для их группировки.

Состав групп формируется из центров (объектов выборки) для гипершаров, в пересечении которых содержатся граничные объекты.

Значение меры компактности вычисляется как среднее число объектов обучающей выборки за вычетом шумовых, притягиваемое одним эталоном минимального покрытия.

Выполняется анализ связи обобщающей способности алгоритмов при машинном обучении со значением меры компактности.

Наличие связи обосновывается по критерию (регуляризатору) для отбора числа и состава множества шумовых объектов.

Основные результаты: Показана связь между значением меры компактности обучающей выборки и обобщающей способностью алгоритмов распознавания.

Связь выявлена по эталонам минимального покрытия выборки, из которых сформирована база прецедентов.

Обнаружено, что точность распознавания по базе прецедентов выше, чем на исходной выборке.

Минима

Сохранить в закладках