基于多智能体强化学习的月面极端区域协同探测方法 |
| |
引用本文: | 张杨,颜鹏,谢旭东,白成超.基于多智能体强化学习的月面极端区域协同探测方法[J].载人航天,2023(1):78-87. |
| |
作者姓名: | 张杨 颜鹏 谢旭东 白成超 |
| |
作者单位: | 1. 中国空间技术研究院;2. 哈尔滨工业大学航天学院 |
| |
摘 要: | 针对单个月球车难以高效鲁棒地探测月面极端区域的问题,提出了一种基于多智能体强化学习的月球车协同探测方法。首先,将探测区域进行离散化处理,并使用栅格地图表达探测信息及各月球车的位置信息,然后,使用深度神经网络对视觉图像信息、激光雷达信息以及栅格地图信息进行特征提取;之后,在多智能体强化学习的架构下学习月球车的协同探测策略,通过设计考虑探测时间、安全约束及通信约束的奖励函数,使月球车可以快速安全地对月面极端区域进行协同探测;最后,在Gazebo中搭建了月面仿真环境并进行了仿真验证。结果表明:所提出的方法具备较高的探测效率与较好的安全保障。
|
关 键 词: | 月球车 月面极端区域 协同探测 多智能体强化学习 |
|
|