首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种动态环境下空间机器人的快速路径规划方法
引用本文:胡晓东,黄学祥,胡天健,王峰林,梁书立.一种动态环境下空间机器人的快速路径规划方法[J].空间控制技术与应用,2018,44(5):14-21.
作者姓名:胡晓东  黄学祥  胡天健  王峰林  梁书立
作者单位:北京跟踪与通信技术研究所
摘    要:针对动态环境下空间机器人采用深度强化学习进行路径规划时存在的收敛速度慢问题,采用迁移学习算法设计了一种适应动态环境的快速路径规划器.首先,综合考虑空间机器人运动过程中存在的避障、时间和扰动约束,在静态环境下对深度神经网络进行预训练.其次,将上述训练后的权值作为动态环境下深度神经网络的初始权值,再经过动态环境下的训练进行参数微调.最后,以平面五自由度空间机器人为例对所设计的方法进行了验证,并与直接训练方法进行了比较.实验结果表明,该方法能够将训练收敛时间从1033回合缩短到450回合,在保证规划路径准确率的前提下,提高训练的收敛速度.

关 键 词:空间机器人  路径规划  迁移学习  深度强化学习  动态环境  
本文献已被 CNKI 等数据库收录!
点击此处可从《空间控制技术与应用》浏览原始摘要信息
点击此处可从《空间控制技术与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号