Застосування адаптованого алгоритму utility ai для групової взаємодії інтелектуальних агентів без обміну інформацією
DOI:
https://doi.org/10.20535/1560-8956.43.2023.292249Ключові слова:
Utility AI, взаємодія без комунікації, групова взаємодія, середовище моделювання, моделі поведінки, методи прийняття рішеньАнотація
Предметом дослідження є командна взаємодія інтелектуальних агентів на прикладі футболу. У статті описано результати застосування модифікованого алгоритму Utility AI для забезпечення командної взаємодії в умовах відсутності комунікації. Зроблено огляд та порівняння найбільш близьких рішень. Так в статті наведено розробки, що
застосовуються в змаганнях «Drop-in player challenge» кубку RoboCup, дослідженнях мультиагентного навчання з підкріпленням університету Іллінойс та алгоритм жорсткої фіксації сценаріїв поведінки у випадку короткочасної втрати зв’язку. Коротко описаний алгоритм Utility AI, що застосовується переважно в ігрових застосунках для реалізації штучного інтелекту. Пропонується використання додаткових вагових коефіцієнтів алгоритмом для формування певної рольової поведінки. Також архітектура розділяється на два прошарки. Перший застосовує саме модифіковану
версію Utility Ai для групової координації. Другий – дерево прийняття рішень для індивідуальної тактики. Тестування проводилися в симульованому середовищі футбольного поля – RoboCup. Продемонстровано поетапне трасування ігрового сценарію з наведеними у таблиці вихідними даними та відповідні їм прийняті рішення. Також наданий приклад детального розрахунку алгоритмом майбутньої дії відповідно до обстановки.
Бібл. 8, іл. 3, табл. 3
Посилання
Robocup офіційний сайт [Електронний ресурс] – Режим доступу до ресурсу: https://www.robocup.org/.
Drop-in games at RoboCup / P.Stone, P. MacAlpine, K. Genter, S. Barrett. // AI Matters. – 2014. – P. 20–22.
Graham D. An Introduction to Utility Theory [Електронний ресурс] / David Graham – Режим доступу до ресурсу: http://www.gameaipro.com/ GameAIPro/ GameAIPro/Chapter09/An_Introduction_ to_Utility_Theory.pdf.
Disentangling Successor Features for Coordination in Multi-agent Reinforcement Learning / S.Kim, G. Chowdhary, N. Stralen, H. Tran. // Carnel University. – 2022.
Amini A. Using Cooperation without Communication in a Multi-Agent Unpredictable Dynamic Real-Time Environment / Ali Amini. // Journal of Basic and Applied Scientific Research. – 2012. – №9. – P. 9705–9709.
Катренко А. В. Теорія прийняття рішень / А. В. Катренко, В. В. Пасічник, В. П. Пасько. – Київ: Видавнича група BHV, 2009. – 448 с. – (Видавнича група BHV). – (175).
Романенко Л. А. Базові методи прийняття рішення в задачах групового управління в середовищі симулювання футболу інтелектуальних агентів / Л. А. Романенко, О. Д. Фіногенов. // Адаптивні системи автоматичного управління. – 2022. – №40. – С. 118–128.
Robocup. Інструкція користувача [Електронний ресурс] – Режим доступу до ресурсу: https://rcsoccersim.readthedocs.io/en/latest/
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.
2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.
3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.