首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于多智能体强化学习的月面极端区域协同探测方法
引用本文:张杨,颜鹏,谢旭东,白成超.基于多智能体强化学习的月面极端区域协同探测方法[J].载人航天,2023(1):78-87.
作者姓名:张杨  颜鹏  谢旭东  白成超
作者单位:1. 中国空间技术研究院;2. 哈尔滨工业大学航天学院
摘    要:针对单个月球车难以高效鲁棒地探测月面极端区域的问题,提出了一种基于多智能体强化学习的月球车协同探测方法。首先,将探测区域进行离散化处理,并使用栅格地图表达探测信息及各月球车的位置信息,然后,使用深度神经网络对视觉图像信息、激光雷达信息以及栅格地图信息进行特征提取;之后,在多智能体强化学习的架构下学习月球车的协同探测策略,通过设计考虑探测时间、安全约束及通信约束的奖励函数,使月球车可以快速安全地对月面极端区域进行协同探测;最后,在Gazebo中搭建了月面仿真环境并进行了仿真验证。结果表明:所提出的方法具备较高的探测效率与较好的安全保障。

关 键 词:月球车  月面极端区域  协同探测  多智能体强化学习
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号