基于多智能体强化学习的空间机械臂轨迹规划期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于多智能体强化学习的空间机械臂轨迹规划

作者姓名：	赵毓管公顺郭继峰于晓强颜鹏

作者单位：	哈尔滨工业大学航天学院,哈尔滨150001;哈尔滨工业大学航天学院,哈尔滨150001;哈尔滨工业大学航天学院,哈尔滨150001;哈尔滨工业大学航天学院,哈尔滨150001;哈尔滨工业大学航天学院,哈尔滨150001

基金项目：	国家自然科学基金（61973101）;航空科学基金（20180577005）

摘要：	针对某型六自由度（DOF）空间漂浮机械臂对运动目标捕捉场景,开展了基于深度强化学习的在线轨迹规划方法研究。首先给出了机械臂DH （Denavit-Hartenberg）模型,考虑组合体力学耦合特性建立了多刚体运动学和动力学模型。然后提出了一种改进深度确定性策略梯度算法,以各关节为决策智能体建立了多智能体自学习系统。而后建立了"线下集中学习,线上分布执行"的空间机械臂对匀速直线运动目标捕捉训练系统,构建以目标相对距离和总操作时间为参数的奖励函数。最后通过数学仿真验证,实现了机械臂对各向匀速运动目标的快速捕捉,平均完成耗时5.4 s。与传统基于随机采样的规划算法对比,本文提出的自主决策运动规划方法求解速度和鲁棒性更优。
关键词：	机械臂轨迹规划多智能体策略梯度在轨捕捉
收稿时间：	2020-04-28
修稿时间：	2020-05-21
本文献已被万方数据等数据库收录！
	点击此处可从《航空学报》浏览原始摘要信息
	点击此处可从《航空学报》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏