Інтелектуальна модель автономного паркування для різних типів паркувальних місць на основі глибокого навчання з підкріпленням

Автор(и)

  • В. Олійник КПІ ім. Ігоря Сікорського, Україна
  • Ю. Данилюк КПІ ім. Ігоря Сікорського, Україна

DOI:

https://doi.org/10.20535/1560-8956.46.2025.323821

Ключові слова:

автоматичне паркування, самокерований автомобіль, глибоке навчання з підкріпленням, Proximal Policy Optimization, ML-Agents, Unity, віртуальне середовище

Анотація

Стаття присвячена задачі моделювання процесу автоматизованого паркування у віртуальному середовищі з використанням різних типів паркувальних майданчиків. Метою дослідження є розробка інтелектуальної моделі для автономного паркування, яка забезпечує високу ефективність у симульованих умовах для широкого спектра поширених типів паркувальних майданчиків. В роботі використовується підхід на основі глибокого навчання з
підкріпленням, зокрема, алгоритм Proximal Policy Optimization (PPO), доповнений методами імітаційного навчання за допомогою поведінкового копіювання (Behavioral Cloning) та генеративного змагального імітаційного навчання (Generative Adversarial Imitation Learning). Оптимізована модель досягає високих показників точності  паркування, що варіюються від 96,3% до 99,34% залежно від типу паркувального майданчика. Розроблене симуляційне середовище, створене на основі ігрового рушія Unity та плагіна ML-Agents, забезпечує високоякісну візуалізацію, симуляцію та
моделювання, що робить його цінним як для освітніх, так і для наукових цілей.

Бібл. 18, іл. 5, табл. 2

Посилання

Level-5 autonomous driving - are we there yet? A review of research literature / Khan M. A. et al. // ACM Computing Surveys (CSUR), Vol. 55, No. 2, 2022. – P. 1–38.

Mrinal R. Bachute, Javed M. Subhedar. Autonomous Driving Architectures: Insights of Machine Learning and Deep Learning Algorithms // Machine Learning with Applications, Vol. 6, 2021. URL: https://doi.org/10.1016/j.mlwa.2021.100164.

Lapan M. Deep Reinforcement Learning Hands-On (2nd Revised edition). Packt Publishing, 2022.

Lai Leonardo. (2020). "Automatic parking with Q-Learning". URL: https://leoll2.github.io/Autoparking/docs/paper_short.pdf (application date: 15.01.2025)

Junzuo Li, Qiang Long. (2021, March 26). An Automatic Parking Model Based on Deep Reinforcement Learning // Journal of Physics: Conference Series. Volume 1883, 2nd International Conference on Computer Information and Big Data Applications, 2021 .

Yuzheng Zhuang, Qiang Gu, Bin Wang, Jun Luo, Hongbo Zhang, Wulong Liu. (2018). Robust Auto-parking: Reinforcement Learning based Real-time Planning Approach with Domain Template // NIPS 2018 Workshop on Machine Learning for Intelligent Transportation Systems (MLITS), 2018.

Unity". Unity Technologies. https://unity.com (application date: 15.01.2025)

"ML-Agents (Machine Learning Agents)". Unity Technologies. URL: https://unity.com/products/machine-learning-agents (application date: 15.01.2025)

"Dimensions.com". Dimensions. URL: https://www.dimensions.com (application date 15.01.2025)

Tyavin Vitaly. (2020, December 8) "Low Poly Soviet Cars Pack" [Unity asset]. Unity Asset Store. URL: https://assetstore.unity.com/packages/3d/vehicles/low-poly-sovietcars-pack-184453. (application date: 15.01.2025)

Олійник В.В., Яременко Є.А. Алгоритм уточненого позиціонування в навігаційних системах доповненої реальності // Міжвідомчий науково-технічний збірник «Адаптивні системи автономного управління», К: Політехніка, 2018. Т.2, №33. – С. 56-65.

Oliinyk V. Method for improving accuracy of mobile AR navigators // ISJ Industry 4.0, Vol. 5, Is. 1, 2020. – P. 21-22.

Oliinyk V., Ryzhiy A. An efficient face mask detection model for real-time applications // Adaptive systems of automatic control, 2022. Vol. 1, №40. – P. 54-64.

Пантелеев А.С., Олейник В.В. Метод визуального мультитрекинга в реальном времени на основе корреляционных фильтров // Міжвідомчий науково-технічний збірник "Адаптивні системи Автоматичного Управління", К: Політехніка - 2018. - Т.1, №32 – С. 97-106.

OpenAI Baselines PPO. URL: https://openai.com/research/openai-baselines-ppo (application date: 15.01.2025)

Tung Nguyen, Qinqing Zheng, Aditya Grover. (2022, October 11). Reliable Conditioning of Behavioral Cloning for Offline Reinforcement Learning. URL: https://arxiv.org/abs/2210.05158 (application date: 15.01.2025)

Jongcheon Park, Seungyong Han, Sangmoon Lee. Restored Action Generative Adversarial Imitation Learning from observation for robot manipulator // ISA Transactions, Volume 129, Part B, 2022. – P. 684-690.

Hatsan S., Oliinyk V. Computer vision based authentication model with spoofing protection // The International Conference on Security, Fault Tolerance, Intelligence ICSFTI2024 (June 07, 2024, Kyiv, Ukraine), 2024. P. 1-12. URL: https://icsftiproc.kpi.ua/article/view/308401 (application date: 15.01.2025)

##submission.downloads##

Опубліковано

2025-02-26