Система пошуку невідомого розташування цілей у відомому середовищі з використанням навчання з підкріпленням

Автор(и)

  • Й. Альбрехт КПІ ім. Ігоря Сікорського, Україна
  • A. Писаренко КПІ ім. Ігоря Сікорського, Україна

DOI:

https://doi.org/10.20535/1560-8956.42.2023.278920

Ключові слова:

навчання з підкріпленням, система пошукових модулів,, виявлення об'єктів

Анотація

Об’єктом дослідження є система пошукових модулів. У статті зроблено огляд існуючих досліджень систем пошукових модулів, а також можливостей використання навчання з підкріпленням у дослідженнях з даними системами. На
сьогоднішній день існують дослідження успішного використання навчання з підкріпленням для різних моделей систем, що складаються з модулів. У статті використовувалось навчання з підкріпленням на двох рівнях: на першому об’єктом був сам модуль а на другому ціла система. Метою роботи є підвищення ефективності пошуку об'єктів у відомому
середовищі з використанням навчання з підкріпленням. Для цього було проведено ряд експериментів. Перший експеримент визначав можливість отримання оптимальних результатів з використанням навчання з підкріпленням до об'єкту дослідження. В ході другого експерименту було проведено порівняння можливостей даної системи з такою
ж кількістю окремих модулів, що працюють окремо для пошуків нерухомих об'єктів. А в третьому експерименті було проведено порівняння об'єкту дослідження в пошуку рухомих об'єктів. Отримані результати вказують на те, що використання системи пошукових модулів є ефективнішим за використання окремих модулів для даного типу
задач. Дослідження можна продовжити і розвинути в наступних напрямках: збільшивши кількість об'єктів, кількість модулів і розміри середовища, залучивши більші обчислювальні здатності, провівши дослідження в тривимірному середовищі, додавши більше параметрів, які впливають на експеримент (заряд модулів, можливість втрати модулів тощо).

Бібл. 5, іл. 4.

Посилання

Playing Atari with Deep Reinforcement Learning/ Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller // NIPS Deep Learning Workshop. – 2013.

Swarm modelling with dynamic mode decomposition / E. Hansen, S. L. Brunton, and Z. Song // Neural and Evolutionary Computing. – 2022.

A Scalable Reinforcement Learning Approach for Attack Allocation in Swarm to Swarm Engagement Problems / Umut Demir, Nazim Kemal Ure // Robotics. – 2022.

Distributed Machine Learning for UAV Swarms: Computing, Sensing, and Semantics / Yahao Ding, Zhaohui Yang, Quoc-Viet Pham, Zhaoyang Zhang, Mohammad Shikh-Bahaei // Machine Learning. – 2023.

Deep Reinforcement Learning for Swarm Robots / Maximilian Hüttenrauch, Adrian Sosić, Gerhard Neumann // Journal of Machine Learning Research. – 2019. – T.20.

##submission.downloads##

Опубліковано

2023-05-01