基于通信的协作型多智能体强化学习算法综述 |
| |
引用本文: | 田琪,吴飞.基于通信的协作型多智能体强化学习算法综述[J].航天控制,2023(4):13-19. |
| |
作者姓名: | 田琪 吴飞 |
| |
作者单位: | 浙江大学计算机科学与技术学院 |
| |
摘 要: | 多智能体系统在许多实际领域中得到了广泛应用,包括机器人技术、分布式控制和多人游戏等。这些领域中的许多复杂任务无法通过预定义的智能体行为来解决,而基于通信的多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)技术是应对这些挑战的有效方法之一。该领域存在2个核心问题:1)如何建立有效的多智能体通信机制,从而提升多智能体系统的整体性能;2)在带宽受限的场景下,如何设计高效的通信调度方案从而压缩通信过程中冗余信息。本文首先对处理这两个核心问题的文献进行了概述并重点介绍具有代表性的一些工作,接着说明其在航天领域的应用前景,最后进行总结。
|
关 键 词: | 强化学习 通信机制 多智能体系统 |
|
|