EISSN 2518-1092

· Языки: ru / en

Статья: СРАВНИТЕЛЬНЫЙ АНАЛИЗ АЛГОРИТМОВ ГЛУБОКОГО ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ DDPG, PPO И SAC ДЛЯ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ АВТОМОБИЛЕМ В СИМУЛЯТОРЕ CARLA (2024)

Читать

Статья Литература Выпуск Статистика Издательство

Читать онлайн

В данной статье представлен сравнительный анализ трех передовых алгоритмов глубокого обучения с подкреплением: Deep Deterministic Policy Gradient (DDPG), Proximal Policy Optimization (PPO) и Soft Actor-Critic (SAC), реализованных в библиотеке Stable Baselines 3. Целью исследования является оценка эффективности и применимости каждого из алгоритмов для задачи управления беспилотным автомобилем в сложной и динамичной среде, предоставляемой симулятором CARLA, с акцентом на такие ключевые показатели, как суммарная дистанция, суммарное вознаграждение, средняя скорость, отклонение от центра дорожной полосы и доля успешных эпизодов. Авторы подробно описывают методологию экспериментального тестирования, включая настройку параметров обучения и критерии оценки производительности. Результаты экспериментов демонстрируют различия в производительности алгоритмов, выявляя их сильные и слабые стороны в контексте автономного вождения. Статья вносит вклад в понимание преимуществ и ограничений каждого алгоритма в контексте автономного вождения и предлагает рекомендации по их практическому применению.

Ключевые фразы: глубокое обучение с подкреплением, автономное вождение, DDPG, PPO, SAC, Stable Baselines 3, CARLA

Автор (ы): Тихонов Максим Константинович (Tihonov M. K.)

Журнал: НАУЧНЫЙ РЕЗУЛЬТАТ. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

Идентификаторы и классификаторы

УДК: 004.8. Искусственный интеллект

Для цитирования:

ТИХОНОВ М. К. СРАВНИТЕЛЬНЫЙ АНАЛИЗ АЛГОРИТМОВ ГЛУБОКОГО ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ DDPG, PPO И SAC ДЛЯ УПРАВЛЕНИЯ БЕСПИЛОТНЫМ АВТОМОБИЛЕМ В СИМУЛЯТОРЕ CARLA // НАУЧНЫЙ РЕЗУЛЬТАТ. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ. 2024. ТОМ 9, № 2

Текстовый фрагмент статьи

Моя история просмотров (10)

01. Статья: ИНТЕЛЛЕКТУАЛИЗАЦИЯ ПРОЦЕССОВ ПРИНЯТИЯ РЕШЕНИЙ В СИСТЕМАХ УПРАВЛЕНИЯ РИСКАМИ НА БАЗЕ НЕЙРОННЫХ СЕТЕЙ СЕМЕЙСТВА ART

02. Статья: ЗАВИСИМОСТЬ НЕОБХОДИМОСТИ ХИРУРГИЧЕСКОЙ КОРРЕКЦИИ МИОПИИ ОТ УЧЕБНОЙ НАГРУЗКИ У СТУДЕНТОВ МЕДИЦИНСКИХ ВУЗОВ

03. Статья: ТЕНДЕНЦИИ РАЗВИТИЯ И ПРОБЛЕМЫ СОВРЕМЕННОЙ ФРАЗЕОЛОГИИ

04. Статья: Оптимизация организационно-экономических механизмов в хлебопекарной отрасли на основе успешных практик региональной поддержки в России

05. Статья: К ВОПРОСУ ОБ ИЗУЧЕНИИ ЭКСТРЕМИСТСКИХ СКЛОННОСТЕЙ СРЕДИ МОЛОДЕЖИ

06. Статья: ИССЛЕДОВАНИЕ НЕРАВНОМЕРНОСТИ ТЕМПЕРАТУРНОГО ПОЛЯ В ОБЪЕМЕ КОНДИЦИОНИРУЕМОГО ПОМЕЩЕНИЯ ОФИСНОГО ЗДАНИЯ

07. Статья: МЯСНАЯ ПРОДУКТИВНОСТЬ ПОТОМКОВ БЫКОВ-УЛУЧШАТЕЛЕЙ КАЛМЫЦКОЙ ПОРОДЫ

08. Статья: МОДЕЛЬ И МЕТОД ОБНАРУЖЕНИЯ ИНФОРМАЦИОННЫХ КАМПАНИЙ

09. Статья: РАФАИЛ ЗИНУРОВ - АВТОР ИСТОРИЧЕСКИХ ДАСТАНОВ

10. Статья: ГРИБНЫЕ И ЯГОДНЫЕ ТУРЫ В МУРМАНСКУЮ ОБЛАСТЬ: РЕАЛИИ И ПЕРСПЕКТИВЫ

Будьте первым, кто начнет обсуждение

Если у вас возникли вопросы или появились предложения по содержанию статьи, пожалуйста, направляйте их в рамках данной темы.

Создать тему для обсуждения

Список литературы

Lillicrap T.P. et al. Continuous control with deep reinforcement learning // arXiv preprint arXiv:1509.02971. – 2015.
Chang C.C. et al. Autonomous driving control using the ddpg and rdpg algorithms // Applied Sciences. – 2021. – Т. 11. – №. 22. – С. 10659.
Schulman J. et al. Proximal policy optimization algorithms // arXiv preprint arXiv:1707.06347. – 2017.
Emuna R., Borowsky A., Biess A. Deep reinforcement learning for human-like driving policies in collision avoidance tasks of self-driving cars // arXiv preprint arXiv:2006.04218. – 2020.
Haarnoja T. et al. Soft actor-critic: Off-policy maximum entropy deep reinforcement learning with a stochastic actor // International conference on machine learning. – PMLR, 2018. – P. 1861-1870.
Ke P., Yanxin Z., Chenkun Y. A decision-making method for Self-driving based on deep reinforcement learning // Journal of Physics: Conference Series. – IOP Publishing, 2020. – Т. 1576. – №. 1. – P. 012025.
Youssef F., Houda B. Comparative study of end-to-end deep learning methods for self-driving car // International Journal of Intelligent Systems and Applications. – 2020. – Т. 12. – P. 15-27.
Li D., Okhrin O. Modified DDPG car-following model with a real-world human driving experience with CARLA simulator // Transportation research part C: emerging technologies. – 2023. – Т. 147. – P. 103987.

Выпуск

Том 9, № 2 (2024)

Кол-во страниц: 74 страницы

Другие статьи выпуска

ОБ ИСПОЛЬЗОВАНИИ МАШИННОГО ОБУЧЕНИЯ ПРИ МОДЕЛИРОВАНИИ БИЗНЕС-ПРОЦЕССОВ (2024)

Авторы: Удахина С. В., Мерзликина А. А.

В условиях высокой конкурентности, а также активизации внутреннего производственного рынка предприятиям нужно быстро адаптироваться к современным условиям. Очевиден рост количества малых производственных предприятий, которые участвуют в тендерах на электронных торговых площадках и предлагают свои услуги крупным предприятиям, особенно этот рост заметен в области военно-промышленного комплекса. Заказчики предпочитают сотрудничать с малыми предприятиями, которые адаптивны к условиям заказа, а также имеют не только короткие сроки исполнения заказа, но еще и гибкую систему ценообразования благодаря низким административным и бюрократическим издержкам. Такие предприятия при росте объема заказов сталкиваются с проблемами в части организации бизнес-процессов. В работе авторами построена модель процесса «Контроль качества» с использованием метода BPMN на основе практики малого предприятия, которая может являться основой для обучения системы машинного обучения по построению модели бизнес-процессов. В качестве области искусственного интеллекта предложена обработка текстов на естественном языке, что позволит предприятиям использовать данную унифицированную технологию для сокращения издержек на разработку и описание бизнес-процессов.

Сохранить в закладках

ХОЛАКРАТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ В ОРГАНИЗАЦИОННЫХ СИСТЕМАХ (2024)

Авторы: Кротов Я. Е.

В данной статье представлены результаты анализа актуальных исследований применения холакратических моделей управления для высокотехнологичных отраслей экономики как Российской Федерации, так и за её пределами. Актуальность исследований в области применения концептуальных моделей управления в организационных системах обусловлена вызовами конкуренции эффективных бизнес-моделей и непрерывной оптимизации внутренних издержек высокотехнологичных предприятий. Проблема быстрого перехода от классических каскадных и дивизионных моделей к холакратическим обусловлена потребностями экономики в появлении методов и моделей управления, которые обеспечат качественные процессные и экономические изменения без негативного влияния на цепочку поставок и процесс создания товаров или услуг с высокой добавленной стоимостью. В рамках настоящего исследования представлено сравнение классических методов управления в организационных системах против холакратических. Проблемный анализ также учитывал математические особенности сравнения существующих моделей управления. Результаты исследования, представленные в настоящей статье, говорят о том, что начинает формироваться потребность в методологии быстрого перехода на холакратические модели управления в организационных системах, а также создание концептуальной математической модели идеальной холакратической организации. В качестве выводов можно отметить наличие функционально-процессных разрывов при переходе на новую модель, в том числе их математические аспекты при заданных условиях.

Сохранить в закладках

АНАЛИЗ СИСТЕМ ОБНАРУЖЕНИЯ И ПРЕДОТВРАЩЕНИЯ ВТОРЖЕНИЯ С ОТКРЫТЫМ КОДОМ ДЛЯ ИНТЕГРАЦИИ С ОТЕЧЕСТВЕННЫМИ ОПЕРАЦИОННЫМИ СИСТЕМАМИ (2024)

Авторы: Надейкина В. С., Маслова М. А.

В статье были рассмотрены такие IDS/IPS как Snort, Suricata, Fail2Ban и OSSEC, имеющие открытый исходный код. Проанализированы их механизмы обеспечения сетевой безопасности, включая архитектуру, функции, инструменты и реализуемые задачи. Рассмотрена возможность интеграции этих систем с отечественными операционными системами. В заключении подчеркивается, что IDS/IPS являются лишь одним из многих слоев защиты, которые должны быть внедрены для эффективного обеспечения безопасности. Только комплексный подход к безопасности может являться ключом к защите от современных киберугроз.

Сохранить в закладках

ИНСТРУМЕНТАЛЬНАЯ ПОДДЕРЖКА ПОСТРОЕНИЯ И ИСПОЛЬЗОВАНИЯ СИСТЕМНО-ОБЪЕКТНОЙ ТРЕХМЕРНОЙ КЛАССИФИКАЦИИ (2024)

Авторы: Маторин С. И., Гуль С. В., Федоренко А. В.

В статье обсуждается задача инструментальной поддержки процедур построения и использования с применением системно-объектного подхода трехмерной классификации (СО3К). Показаны на конкретных примерах возможности прогнозирования и поддержки управления с помощью СО3К. Представлены результаты исследования существующего инструментария концептуального классификационного моделирования (онтологического инжиниринга), показывающие, что с его помощью невозможно обеспечит построение и использование СО3К. В целях создания инструментального программного обеспечения, поддерживающего построение и использование СО3К, разработан набор функциональных требований к нему в виде UML-диаграммы вариантов использования (прецедентов) и диаграмм активности как потоков событий к ним.

Сохранить в закладках

МЕТОДЫ ВНЕДРЕНИЯ КОНТРОЛЬНОЙ ИНФОРМАЦИИ В ИЗОБРАЖЕНИЯ (2024)

Авторы: Чурсин Д. С.

В работе рассматриваются различные методы стеганографии, используемые для внедрения контрольной информации в цифровые изображения. Основное внимание уделяется принципам работы, преимуществам и недостаткам каждого метода. Рассмотрены классические и современные методы, такие как LSB, FFT, PVD, MPVD, DCT, S-UNIWARD, WOW, HUGO и Steghide. Анализируются их устойчивость к стегоанализу, стеганографическая емкость и вычислительная сложность. Понимание этих методов позволяет повысить эффективность и безопасность использования стеганографических техник в различных практических задачах.

Сохранить в закладках

ИССЛЕДОВАНИЕ МЕТОДОВ АУТЕНТИФИКАЦИИ НА ВЕБ-СЕРВИСАХ. ТЕКУЩИЕ ТЕНДЕНЦИИ И ПЕРСПЕКТИВЫ РАЗВИТИЯ (2024)

Авторы: Абселямов А. А., Лагуткина Т. В.

При развитии информационных технологий, обеспечение и защита данных на веб-сервисах имеет важное значений. Для обеспечения безопасности применяют различные методы и одним из главных есть процесс аутентификации пользователей. Применяют разные методы аутентификации: парольную, двухфакторную аутентификацию, биометрическую, многофакторную, на основе искусственного интеллекта и блокчейн технологий. Несмотря на их многообразие, каждый метод имеет свои преимущества и недостатки. Текущие тенденции в области аутентификации включают комбинирование различных методов для повышения надежности и улучшение пользовательского опыта. Перспективы развития данной технологии связаны с поиском новых способов балансировки между безопасностью и удобством использования, а также постоянным обновлениям и адаптацией методов к изменяющимся угрозам безопасности. В данной статье проводится исследование различных методов аутентификации на веб-сервисах с целью выявления их эффективности, преимуществ и недостатков.

Сохранить в закладках

ОБ ОЦЕНИВАНИИ РАЗМЕРОВ ИНФОРМАТИВНЫХ ФРАГМЕНТОВ НА ИЗОБРАЖЕНИЯХ МОРСКОЙ ПОВЕРХНОСТИ (2024)

Авторы: Черноморец Д. А., Болгова Е. В., Черноморец А. А., Петина М. А.

В работе предложено решение одной из задач, возникающих при построении современных систем безопасности движения в морских акваториях, а именно, оценивание размеров информативных фрагментов на изображении, которые представляется целесообразным использовать при обнаружении посторонних объектов на изображении морской поверхности. Оценивание размеров информативных фрагментов предложено осуществлять на основании вычисления среднего расстояния между контурами видимых на изображении элементов волн, такими как их гребни, впадины и др. Контуры данных элементов волн определяются на основе оператора Кэнни. Оценивание размеров информативных фрагментов выполняется вдоль столбцов и строк анализируемого изображения. Проведены вычислительные эксперименты, иллюстрирующие работоспособность разработанного алгоритма. Полученные оценки размеров информативных фрагментов изображений морской поверхности представляется целесообразным применять при их анализе, в частности, при решении задач обнаружения посторонних объектов на изображениях морской поверхности.

Сохранить в закладках

Статистика статьи

Статистика просмотров за 2025 - 2026 год.

Издательство

Издательство: БелГУ
Регион: Россия, Белгород
Почтовый адрес: 308015, г. Белгород, ул. Победы, 85
Юр. адрес: 308015, г. Белгород, ул. Победы, 85
ФИО: Полухин Олег Николаевич (Руководитель)
E-mail адрес: Info@bsu.edu.ru
Контактный телефон: +7 (472) 2559809
Сайт: https:/bsuedu.ru

Все права на тексты и товарные знаки принадлежат их законным владельцам. Подробнее...

Сайт https://scinetwork.ru (далее – сайт) работает по принципу агрегатора – собирает и структурирует информацию из публичных источников в сети Интернет, то есть передает полнотекстовую информацию о товарных знаках в том виде, в котором она содержится в открытом доступе.

Сайт и администрация сайта не используют отображаемые на сайте товарные знаки в коммерческих и рекламных целях, не декларируют своего участия в процессе их государственной регистрации, не заявляют о своих исключительных правах на товарные знаки, а также не гарантируют точность, полноту и достоверность информации.

Все права на товарные знаки принадлежат их законным владельцам!

Сайт носит исключительно информационный характер, и предоставляемые им сведения являются открытыми публичными данными.

Администрация сайта не несет ответственность за какие бы то ни было убытки, возникающие в результате доступа и использования сайта.

Спасибо, понятно.

Сказать «Спасибо»

Вы можете поблагодарить автора за публикацию. Ему (ей) будет приятно.

Наведите камеру на QR-код, чтобы открыть моб. версию страницы.