Архив статей

РАЗРАБОТКА АРХИТЕКТУРЫ УНИВЕРСАЛЬНОГО ФРЕЙМВОРКА ФЕДЕРАТИВНОГО ОБУЧЕНИЯ (2022)

Объектом исследования является технология федеративного обучения, которая позволяет осуществлять коллективное машинное обучение на распределенных обучающих наборах данных без их передачи в единое хранилище. Актуальность данной технологии обусловлена, с одной стороны, давно растущим трендом на использование машинного обучения для решения множества прикладных задач, а с другой - ростом запросов, в том числе законодательных, на приватность и обработку данных ближе к источнику или непосредственно на нем. Основными проблемами при создании систем федеративного обучения являются отсутствие гибких фреймворков для различных сценариев федеративного обучения: большинство существующих решений сосредоточено на обучении искусственных нейронных сетей в централизованной вычислительной среде. Предмет исследования - универсальная архитектура фреймворка для разработки прикладных систем федеративного обучения, позволяющая строить системы для разных сценариев, различных параметров и топологий вычислительной среды, моделей и алгоритмов машинного обучения. В статье рассмотрена предметная область федеративного обучения, даны основные определения и описан процесс федеративного обучения, приведены и разобраны различные сценарии возможных прикладных задач. Проведен анализ наиболее известных на данный момент фреймворков федеративного обучения, а также их применения для возможных сценариев использования. В качестве результата описана архитектура универсального фреймворка, который, в отличие от существующих, может быть использован для разработки прикладных систем федеративного обучения разного типа и разных сценариев использования.

АВТОМАТИЗИРОВАННОЕ ДЕТЕКТИРОВАНИЕ И КЛАССИФИКАЦИЯ ОБЪЕКТОВ В ТРАНСПОРТНОМ ПОТОКЕ НА СПУТНИКОВЫХ СНИМКАХ ГОРОДА (2022)
Выпуск: Т. 35 № 2 (2022)
Авторы: Тормозов В. С.

В статье рассматриваются разработанные методы детектирования и классификации объектов в транспортном потоке на данных космической съемки сверхвысокого пространственного разрешения. С появлением в свободном доступе больших объемов спутниковых данных все большую актуальность приобретает развитие методов машинного обучения на основании геопространственных данных, в частности, спутниковых. В настоящей работе обоснован выбор источника данных о транспортных потоках - спутниковых снимков сверхвысокого разрешения, рассмотрены основные проблемы и задачи, связанные с распознаванием и классификацией объектов. Целью автора является разработка цепочки алгоритмов, позволяющей с высокой точностью детектировать и классифицировать объекты в транспортных потоках. Исследования основаны на численной оценке качества работы алгоритмов. В работе используются методы распознавания образов, машинного обучения и обработки цифровых изображений. Научная новизна заключается в уникальном алгоритме извлечения изображений локальных участков улично-дорожной сети, алгоритме определения направления дорожного движения объекта, модернизации алгоритма селективного поиска. Следует подчеркнуть, что используемые данные съемки сверхвысокого разрешения появились в доступе для частного использования относительно недавно.

АВТОМАТИЗАЦИЯ ОЦЕНКИ СОСТОЯНИЯ ЭЛЕКТРОСЕТИ В УДАЛЕННЫХ РАЙОНАХ РОССИИ С ИСПОЛЬЗОВАНИЕМ СМАРТ-СТРУКТУР (2022)
Выпуск: Т. 35 № 2 (2022)
Авторы: Шевнина Ю. С.

В статье рассматривается способ автоматизации оценки состояния электросети в удаленных районах России с использованием смарт-структур. Предлагаемый способ реализован в виде мобильного приложения. Смарт-структура, лежащая в основе данного способа, состоит из модулей получения и обработки данных с датчиков, поиска закономерностей характеристик электросети и формирования классификаторов состояний, рекомендаций по ремонту и оптимальному режиму эксплуатации электросети и подстанции. Научная новизна предлагаемого решения заключается в методе анализа и обработки характеристик электросети и их совокупностей. Кроме того, учитываются параметры внешних воздействий в виде природных и техногенных факторов. Метод анализа и обработки информации об электросети и подстанции основан на машинном обучении - логическом анализе данных. Оценка состояния электросети и подстанции важна при исследовании и решении задач прогнозирования изменения состояния электросети, подбора рекомендаций и принятия решений о ремонтных и обслуживающих работах. Метод оценки состояния электросети основан на поиске закономерностей и построении классификаторов и позволяет учитывать все характеристики и параметры электросети, их совокупность и связи между ними. Он также дает возможность анализировать и получать закономерности для неполных и неточных данных, с чем достаточно часто приходится сталкиваться в реальных электросетях. Метод может быть использован при проектировании и обслуживании электросетей и подстанции в труднодоступных и удаленных регионах Российской Федерации. Предлагаемая редукция закономерностей характеристик и их совокупностей на основе их рекуррентной конъюнкции позволяет получать оптимальные классификаторы состояний электросети и подстанции с высокой интерпретируемостью и обобщенностью, что увеличивает точность оценки состояния электросети и, как следствие, точность прогноза поведения, рекомендаций и принятия решений о ремонтных работах и оптимальном режиме эксплуатации.

МЕТОД АДАПТИВНОЙ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ (2022)
Выпуск: T. 35 № 1 (2022)
Авторы: Елизаров А. А.

В статье представлен метод классификации изображений с использованием, помимо базовой нейронной сети, дополнительной, способной адаптивно концентрироваться на классифицируемом объекте изображения. Задача дополнительной сети является задачей о контекстном многоруком бандите и сводится к предсказанию такой области на исходном изображении, при вырезании которой в процессе классификации возрастет уверенность базовой нейронной сети в принадлежности объекта на изображении правильному классу. Обучение дополнительной сети происходит с помощью методов обучения с подкреплением и стратегий достижения компромисса между эксплуатацией и исследованием при выборе действий для решения задачи о контекстном многоруком бандите. На подмножестве набора данных ImageNet-1K проведены различные эксперименты по выбору архитектуры нейронной сети, алгоритма обучения с подкреплением и стратегии исследования при обучении. Рассмотрены такие алгоритмы обучения с подкреплением, как DQN, REINFORCE и A2C, и такие стратегии исследования, как -жадная, -softmax, -decay-softmax и метод UCB1. Большое внимание уделено описанию проведенных экспериментов и обоснованию полученных результатов. Предложены варианты применения разработанного метода, демонстрирующие увеличение точности классификации изображений по сравнению с базовой моделью ResNet. Дополнительно рассмотрен вопрос о вычислительной сложности данного метода. Дальнейшие исследования могут быть направлены на обучение агента на изображениях, не задействованных при обучении сети ResNet.

ПОИСК ОПТИМАЛЬНОГО НАБОРА БУКВ ДЛЯ СТИЛЕВОЙ КЛАССИФИКАЦИИ ХУДОЖЕСТВЕННЫХ ТЕКСТОВ МЕТОДОМ СТАТИСТИЧЕСКИХ ИНДЕКСОВ (2023)
Выпуск: Т. 36 № 4 (2023)
Авторы: Горбич Л. Г.

В статье рассматривается проблема улучшения методов стилевой классификации русскоязычных текстов. В качестве возможного направления исследований предложен метод оптимизации набора (множества) букв, применяемого для вычисления статистических индексов текстов. Для оптимизации и контроля результатов использованы поэтические и прозаические художественные тексты на русском языке. Объем текстов составлял порядка 300 тысяч знаков при оптимизации и 100 тысяч знаков при контрольной оценке. Для вычисления статистических индексов рассчитывались частотности биграмм и триграмм букв. При оптимизации опробован также и вариант совместного использования индексов биграмм и триграмм. В статье дано краткое описание метода статистических индексов, приведены применявшиеся в исследовании алгоритм пошаговой оптимизации, вид возможной оптимизационной функции и формула для нахождения границы классификации. Показано, что оптимизация набора букв улучшает классификацию по сравнению с вариантом использования как полного набора букв, так и набора из гласных букв в применении к задаче автоматического различения поэтических и прозаических художественных текстов на русском языке. Проведено сравнение результатов классификации по предложенной формуле границы классификации с результатами расчетов по классификации методом ROC-кривых. В итоге для разных сочетаний статистических индексов и способов определения границы классификации интервал верной классификации составил 72-74 % для набора, включающего все буквы, 82-86 % для набора, включающего только гласные буквы, и 80.5-92.5 % для разных наборов букв, полученных при оптимизации.

МОДЕЛИРОВАНИЕ ПОВЕДЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ НА ОСНОВЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ В МОДЕЛЯХ КОНКУРЕНЦИИ (2023)

В настоящей статье рассматриваются аспекты применения методов машинного обучения к существующим способам моделирования поведения интеллектуальных агентов для обеспечения возможности агентам повысить показатели своей эффективности в моделях конкуренции. Практическая значимость исследования представлена разработкой подхода к моделированию поведения интеллектуальных агентов, за счет которого можно повысить эффективность их функционирования в таких сферах деятельности, как компьютерные игры, разработка беспилотных летательных аппаратов и поисковых роботов, изучение городской и транспортной мобильности, а также в прочих сложных системах. Проведен обзор существующих методов машинного обучения (обучение с подкреплением, глубокое обучение, Q-обучение) и способов моделирования поведения агентов (модель на правилах, конечно-автоматная модель поведения, деревья поведения). Выбрана наиболее подходящая к задаче комбинация метода обучения и модели поведения: деревья поведения и обучение с подкреплением. Средствами Unity реализована тестовая платформа, разработаны модели поведения четырех основных архетипов агентов, которые должны соревноваться в задаче сбора ресурсов в условиях ограниченного времени. Реализован обученный агент с помощью средств Unity ML и TensorFlow. На базе тестовой платформы проведена серия экспериментов в различных условиях: ограниченность, изобилие, среднее количество ресурсов. В рамках эксперимента тестировалась способность разработанной модели поведения интеллектуального агента выигрывать в условиях конкуренции с агентами, снабженными различными вариантами традиционных моделей поведения на базе деревьев поведения. Оценены работоспособность и преимущества использования разработанной модели поведения. Проанализированы результаты эксперимента, сделаны выводы относительно потенциала выбранной комбинации методов.