排序方式: 共有4条查询结果,搜索用时 15 毫秒
1
1.
基于多智能体强化学习的空间机械臂轨迹规划 总被引:1,自引:0,他引:1
针对某型六自由度(DOF)空间漂浮机械臂对运动目标捕捉场景,开展了基于深度强化学习的在线轨迹规划方法研究。首先给出了机械臂DH (Denavit-Hartenberg)模型,考虑组合体力学耦合特性建立了多刚体运动学和动力学模型。然后提出了一种改进深度确定性策略梯度算法,以各关节为决策智能体建立了多智能体自学习系统。而后建立了"线下集中学习,线上分布执行"的空间机械臂对匀速直线运动目标捕捉训练系统,构建以目标相对距离和总操作时间为参数的奖励函数。最后通过数学仿真验证,实现了机械臂对各向匀速运动目标的快速捕捉,平均完成耗时5.4 s。与传统基于随机采样的规划算法对比,本文提出的自主决策运动规划方法求解速度和鲁棒性更优。 相似文献
2.
3.
为提高月面巡视机器人自主探测任务的效率及安全性,提出了一种基于月面数字高程地图的大范围自主探测快速安全路径规划算法。首先根据获取的月面数字高程地图设计了一种地形可通过性分析方法,并生成了欧几里得距离地图(EDM)为安全路径规划提供参考。然后针对A*算法解决月面巡视探测问题时搜索速度慢、未考虑路径安全性的问题,提出了FSA*算法,改进了A*算法的搜索机制以适用于月面大范围路径的快速搜索,并结合EDM地图设计了一种安全启发式函数,可使生成路径尽量远离危险区域,提高了巡视机器人自主探测过程的安全性。最后选取月球艾特肯盆地区域作为仿真场景,验证了该算法的有效性。 相似文献
4.
针对月面超远距离移动规划任务因缺乏精确全局信息而导致的规划路径可通行性不足问题,提出了月面道路拓扑网的构建设想及相应路径规划技术,凭借复杂道路网络的连通能力确保巡视器超远距离规划路径的可通行性。首先进行月面道路拓扑网的设计方法研究,分别提出了基于滑动最优泊松采样算法的网络节点设计方法和基于均匀领邻网络拓扑模型网络结构设计方法,使月面道路网网络节点分布均匀、密度适中且覆盖完整,网络连接合理且各路径尽量远离障碍区域。然后进行基于月面道路拓扑网的超远距离移动规划研究,分析了基于月面道路拓扑网路径规划技术的概率完备性和整体可通行概率,并提出了基于月面道路拓扑网的K优路径规划方法,通过道路网的连通性来提高超远距离移动探测任务的整体可通行概率。最后以阿波罗两次登月任务的着陆点之间进行超远距离转移任务为仿真场景,验证了本方法的有效性。 相似文献
1