Застосування адаптованого алгоритму utility ai для групової взаємодії інтелектуальних агентів без обміну інформацією

Л. Романенко

doi:10.20535/1560-8956.43.2023.292249

Застосування адаптованого алгоритму utility ai для групової взаємодії інтелектуальних агентів без обміну інформацією

Автор(и)

Л. Романенко КПІ ім. Ігоря Сікорського, Україна

DOI:

https://doi.org/10.20535/1560-8956.43.2023.292249

Ключові слова:

Utility AI, взаємодія без комунікації, групова взаємодія, середовище моделювання, моделі поведінки, методи прийняття рішень

Анотація

Предметом дослідження є командна взаємодія інтелектуальних агентів на прикладі футболу. У статті описано результати застосування модифікованого алгоритму Utility AI для забезпечення командної взаємодії в умовах відсутності комунікації. Зроблено огляд та порівняння найбільш близьких рішень. Так в статті наведено розробки, що
застосовуються в змаганнях «Drop-in player challenge» кубку RoboCup, дослідженнях мультиагентного навчання з підкріпленням університету Іллінойс та алгоритм жорсткої фіксації сценаріїв поведінки у випадку короткочасної втрати зв’язку. Коротко описаний алгоритм Utility AI, що застосовується переважно в ігрових застосунках для реалізації штучного інтелекту. Пропонується використання додаткових вагових коефіцієнтів алгоритмом для формування певної рольової поведінки. Також архітектура розділяється на два прошарки. Перший застосовує саме модифіковану
версію Utility Ai для групової координації. Другий – дерево прийняття рішень для індивідуальної тактики. Тестування проводилися в симульованому середовищі футбольного поля – RoboCup. Продемонстровано поетапне трасування ігрового сценарію з наведеними у таблиці вихідними даними та відповідні їм прийняті рішення. Також наданий приклад детального розрахунку алгоритмом майбутньої дії відповідно до обстановки.

Бібл. 8, іл. 3, табл. 3

Посилання

Robocup офіційний сайт [Електронний ресурс] – Режим доступу до ресурсу: https://www.robocup.org/.

Drop-in games at RoboCup / P.Stone, P. MacAlpine, K. Genter, S. Barrett. // AI Matters. – 2014. – P. 20–22.

Graham D. An Introduction to Utility Theory [Електронний ресурс] / David Graham – Режим доступу до ресурсу: http://www.gameaipro.com/ GameAIPro/ GameAIPro/Chapter09/An_Introduction_ to_Utility_Theory.pdf.

Disentangling Successor Features for Coordination in Multi-agent Reinforcement Learning / S.Kim, G. Chowdhary, N. Stralen, H. Tran. // Carnel University. – 2022.

Amini A. Using Cooperation without Communication in a Multi-Agent Unpredictable Dynamic Real-Time Environment / Ali Amini. // Journal of Basic and Applied Scientific Research. – 2012. – №9. – P. 9705–9709.

Катренко А. В. Теорія прийняття рішень / А. В. Катренко, В. В. Пасічник, В. П. Пасько. – Київ: Видавнича група BHV, 2009. – 448 с. – (Видавнича група BHV). – (175).

Романенко Л. А. Базові методи прийняття рішення в задачах групового управління в середовищі симулювання футболу інтелектуальних агентів / Л. А. Романенко, О. Д. Фіногенов. // Адаптивні системи автоматичного управління. – 2022. – №40. – С. 118–128.

Robocup. Інструкція користувача [Електронний ресурс] – Режим доступу до ресурсу: https://rcsoccersim.readthedocs.io/en/latest/

##submission.downloads##

Опубліковано

2023-12-01

Номер

Том 2 № 43 (2023): Адаптивні системи автоматичного управління

Розділ

Статті

Ліцензія

1.Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у нашому журналі.

2. Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована нашим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у нашому журналі.

3. Політика журналу дозволяє і заохочує розміщення рукопису роботи авторами в мережі Інтернет (наприклад, на arXiv.org або на особистих веб-сайтах). Причому рукописи статей можуть бути розміщенні у відкритих архівах як до подання рукопису до редакції, так і під час його редакційного опрацювання. Це сприяє виникненню продуктивної наукової дискусії, позитивно позначається на оперативності ознайомлення наукової спільноти з результатами Ваших досліджень і як наслідок на динаміці цитування вже опублікованої у журналі роботи. Детальніше про це: The Effect of Open Access.

Застосування адаптованого алгоритму utility ai для групової взаємодії інтелектуальних агентів без обміну інформацією

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Номер

Розділ

Ліцензія

Мова

Подати статтю