Застосування адаптованого алгоритму utility ai для групової взаємодії інтелектуальних агентів без обміну інформацією

Автор(и)

  • Л. Романенко КПІ ім. Ігоря Сікорського, Україна

DOI:

https://doi.org/10.20535/1560-8956.43.2023.292249

Ключові слова:

Utility AI, взаємодія без комунікації, групова взаємодія, середовище моделювання, моделі поведінки, методи прийняття рішень

Анотація

Предметом дослідження є командна взаємодія інтелектуальних агентів на прикладі футболу. У статті описано результати застосування модифікованого алгоритму Utility AI для забезпечення командної взаємодії в умовах відсутності комунікації. Зроблено огляд та порівняння найбільш близьких рішень. Так в статті наведено розробки, що
застосовуються в змаганнях «Drop-in player challenge» кубку RoboCup, дослідженнях мультиагентного навчання з підкріпленням університету Іллінойс та алгоритм жорсткої фіксації сценаріїв поведінки у випадку короткочасної втрати зв’язку. Коротко описаний алгоритм Utility AI, що застосовується переважно в ігрових застосунках для реалізації штучного інтелекту. Пропонується використання додаткових вагових коефіцієнтів алгоритмом для формування певної рольової поведінки. Також архітектура розділяється на два прошарки. Перший застосовує саме модифіковану
версію Utility Ai для групової координації. Другий – дерево прийняття рішень для індивідуальної тактики. Тестування проводилися в симульованому середовищі футбольного поля – RoboCup. Продемонстровано поетапне трасування ігрового сценарію з наведеними у таблиці вихідними даними та відповідні їм прийняті рішення. Також наданий приклад детального розрахунку алгоритмом майбутньої дії відповідно до обстановки.

Бібл. 8, іл. 3, табл. 3

Посилання

Robocup офіційний сайт [Електронний ресурс] – Режим доступу до ресурсу: https://www.robocup.org/.

Drop-in games at RoboCup / P.Stone, P. MacAlpine, K. Genter, S. Barrett. // AI Matters. – 2014. – P. 20–22.

Graham D. An Introduction to Utility Theory [Електронний ресурс] / David Graham – Режим доступу до ресурсу: http://www.gameaipro.com/ GameAIPro/ GameAIPro/Chapter09/An_Introduction_ to_Utility_Theory.pdf.

Disentangling Successor Features for Coordination in Multi-agent Reinforcement Learning / S.Kim, G. Chowdhary, N. Stralen, H. Tran. // Carnel University. – 2022.

Amini A. Using Cooperation without Communication in a Multi-Agent Unpredictable Dynamic Real-Time Environment / Ali Amini. // Journal of Basic and Applied Scientific Research. – 2012. – №9. – P. 9705–9709.

Катренко А. В. Теорія прийняття рішень / А. В. Катренко, В. В. Пасічник, В. П. Пасько. – Київ: Видавнича група BHV, 2009. – 448 с. – (Видавнича група BHV). – (175).

Романенко Л. А. Базові методи прийняття рішення в задачах групового управління в середовищі симулювання футболу інтелектуальних агентів / Л. А. Романенко, О. Д. Фіногенов. // Адаптивні системи автоматичного управління. – 2022. – №40. – С. 118–128.

Robocup. Інструкція користувача [Електронний ресурс] – Режим доступу до ресурсу: https://rcsoccersim.readthedocs.io/en/latest/

##submission.downloads##

Опубліковано

2023-12-01