Система пошуку невідомого розташування цілей у відомому середовищі з використанням навчання з підкріпленням
DOI:
https://doi.org/10.20535/1560-8956.42.2023.278920Ключові слова:
навчання з підкріпленням, система пошукових модулів,, виявлення об'єктівАнотація
Об’єктом дослідження є система пошукових модулів. У статті зроблено огляд існуючих досліджень систем пошукових модулів, а також можливостей використання навчання з підкріпленням у дослідженнях з даними системами. На
сьогоднішній день існують дослідження успішного використання навчання з підкріпленням для різних моделей систем, що складаються з модулів. У статті використовувалось навчання з підкріпленням на двох рівнях: на першому об’єктом був сам модуль а на другому ціла система. Метою роботи є підвищення ефективності пошуку об'єктів у відомому
середовищі з використанням навчання з підкріпленням. Для цього було проведено ряд експериментів. Перший експеримент визначав можливість отримання оптимальних результатів з використанням навчання з підкріпленням до об'єкту дослідження. В ході другого експерименту було проведено порівняння можливостей даної системи з такою
ж кількістю окремих модулів, що працюють окремо для пошуків нерухомих об'єктів. А в третьому експерименті було проведено порівняння об'єкту дослідження в пошуку рухомих об'єктів. Отримані результати вказують на те, що використання системи пошукових модулів є ефективнішим за використання окремих модулів для даного типу
задач. Дослідження можна продовжити і розвинути в наступних напрямках: збільшивши кількість об'єктів, кількість модулів і розміри середовища, залучивши більші обчислювальні здатності, провівши дослідження в тривимірному середовищі, додавши більше параметрів, які впливають на експеримент (заряд модулів, можливість втрати модулів тощо).
Бібл. 5, іл. 4.
Посилання
Playing Atari with Deep Reinforcement Learning/ Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Alex Graves, Ioannis Antonoglou, Daan Wierstra, Martin Riedmiller // NIPS Deep Learning Workshop. – 2013.
Swarm modelling with dynamic mode decomposition / E. Hansen, S. L. Brunton, and Z. Song // Neural and Evolutionary Computing. – 2022.
A Scalable Reinforcement Learning Approach for Attack Allocation in Swarm to Swarm Engagement Problems / Umut Demir, Nazim Kemal Ure // Robotics. – 2022.
Distributed Machine Learning for UAV Swarms: Computing, Sensing, and Semantics / Yahao Ding, Zhaohui Yang, Quoc-Viet Pham, Zhaoyang Zhang, Mohammad Shikh-Bahaei // Machine Learning. – 2023.
Deep Reinforcement Learning for Swarm Robots / Maximilian Hüttenrauch, Adrian Sosić, Gerhard Neumann // Journal of Machine Learning Research. – 2019. – T.20.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.