МОДЕЛЮВАННЯ КООПЕРАТИВНОЇ ПОВЕДІНКИ В МУЛЬТИАГЕНТНИХ СИСТЕМАХ
Анотація
Під кооперативною поведінкою розуміють спільноту агентів, які для зменшення середньозважених штрафів вирішують співпрацювати, щоб розв’язати поставлену задачу або досягти певної мети, в нашому випадку синхронізувати світіння.
Проблема формування кооперативної поведінки інтенсивно досліджується у сучасній науковій літературі із застосування мультиагентних систем, наприклад, для дистанційного навчання, керування організаційними системами, побудови різноманітних віртуальних організацій та спільнот, керування розподіленими обчисленнями, керування суспільними інститутами та суспільно-економічними процесами та інших.
У даній роботі розглянуто актуальну тему оптимальних стратегій в іграх з локальною взаємодією, розглянуто стимулююче навчання мультиагентних систем у ігровій постановці.
Метою даної роботи є розгляд методу побудови системи з локальною взаємодією агентів на основі завдання «синхронізації» за допомогою марковської моделі стохастичної гри.
Метод дослідження - комп'ютерна програма для моделювання завдання з використанням Q-методу навчання. Формування коаліцій у мультиагентних системах формулюється як конкурентна або кооперативна задача зарахування об’єкта до одного із кластерів. Розв’язування подібних задач вивчає теорія ігор, а в умовах невизначеності – теорія стохастичних ігор. У зв’язку з цим з наукової та практичної позицій актуальне застосування методів стохастичних ігор для формування коаліцій в умовах неповноти інформації. Рішення стохастичної гри полягає в пошуку стратегій агентів, які максимізують свої виграші, щоб забезпечити певний колективний баланс інтересів для всіх гравців. Для пошуку оптимальних стратегій гравців в умовах невизначеності будемо використовувати метод стимулювання навчання.
Результатом є розроблена ігрова модель, яка забезпечує динамічну самоорганізацію MAC, що проявляється в ритмічній зміні чистих стратегій агентів, які імітують світлові ефекти колонії світлячків. Характерною особливістю розглянутої самоорганізації гри є локально визначена інформація про стратегії поведінки сусідніх агентів, які в результаті навчання призводить до глобальної координації. стратегії всіх агентів.
Наукова новизна отриманих результатів полягає в розробці ігрової моделі, визначені ефективності ігрової самоорганізації стратегій МАС для розв’язування задачі прийняття рішень в системах з кооперативною поведінкою агентів в умовах невизначеності. Повторність значень характеристик гри в різних експериментах з унікальними послідовностями випадкових величин підтверджує достовірність результатів.
Результати можуть бути використані на практиці для моделювання динаміки соціальних процесів, керування соціальними інтернет-сервісами у мережі інтернет та інших.Ключові слова
Повний текст:
PDF (English)Посилання
Kravets P.O. Gaming model of self-organization of multi-agent systems. Bulletin of the National University "Lviv Polytechnic". Series: Information systems and networks: a collection of scientific works. 2015. N829. P. 161-176. URL: http://ena.lp.edu.ua:8080/handle/ntb/31452
Wooldridge M. An Introduction to Multiagent Systems. John Wiley&Sons, 2002. 366 pp.
Weiss, G. Multiagent Systems. A Modern Approach to Distributed Artificial Intelligence. Springer Verlag, Berlin, 1996. 643 pp.
Musiyenko М., Zhuravska І., Kulakovska І., Kulakovska А. Simulation the behavior of robot sub swarm in spatial corridors. 2016 IEEE 36th International Conference on ELECTRONICS and NANOTECHNOLOGY (ELNANO). April 19-21, 2016. Kyiv, Ukraine. Page(s) 382-387. DOI: 10.1109/ELNANO.2016.7493090 http://ieeexplore.ieee.org/document/7493090/
Leslie Kaelbling, Michael L. Littman, Andrew W. Moore. Reinforcement learning: A survey. Journal of Artificial Intelligence Research. 1996. N.4. P. 237–285.
J. Hu, M. P. Wellman. Nash Q-learning for general-sum stochastic games. Machine Learning Research. 2003. N. 4. P. 1039 – 1069.
Gorodetsky V.I. Self-organization and multi-agent systems. I. Models of multi-agent self-organization. Izv. RAS. Theory and control systems. 2012. N. 2. P. 92–120
DOI: https://doi.org/10.35546/піт.v0i24.263
Посилання
- Поки немає зовнішніх посилань.