首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于DDPG-PID的机器人动态目标跟踪与避障控制研究
引用本文:刘勇,李祥,蒋沛阳,孙博熙,吴喆,姜潇,钱森.基于DDPG-PID的机器人动态目标跟踪与避障控制研究[J].南京航空航天大学学报,2022,54(1):41-50.
作者姓名:刘勇  李祥  蒋沛阳  孙博熙  吴喆  姜潇  钱森
作者单位:合肥工业大学机械工程学院,合肥 230009
基金项目:国家自然科学基金(52175013);中央高校基本科研项目(JZ2020HGTB0034)。
摘    要:针对机器人在动态复杂环境下的操作问题,研究机械臂跟踪运动目标及避障的运动控制方法。采用传统PID控制方法与DDPG强化学习算法相结合的方式,利用PID控制使得机械臂的工作平面快速接近目标物并与之重合,再使用DDPG算法让机械臂在平面内自主学习追踪目标物投影同时避开障碍物投影,最终在三维空间中实现跟踪与避障。该方法将机械臂作为一个智能体,智能体通过感知目标物和障碍物的距离偏差来自主学习避障跟踪策略。将本方法用于多自由度机械臂路径规划与避障任务中,对比单纯使用DDPG算法将机械臂作为智能体在空间中进行决策控制,仿真结果显示本文所提出的方法收敛效果和控制性能更好,机械臂能在训练后实现目标物的稳定跟踪和障碍物的躲避。

关 键 词:强化学习  PID控制  路径规划  避障
收稿时间:2021/12/30 0:00:00
修稿时间:2022/1/15 0:00:00

Research on Robot Dynamic Target Tracking and Obstacle Avoidance Control Based on DDPG-PID
LIU Yong,LI Xiang,JIANG Peiyang,SUN Boxi,WU Zhe,JIANG Xiao,QIAN Sen.Research on Robot Dynamic Target Tracking and Obstacle Avoidance Control Based on DDPG-PID[J].Journal of Nanjing University of Aeronautics & Astronautics,2022,54(1):41-50.
Authors:LIU Yong  LI Xiang  JIANG Peiyang  SUN Boxi  WU Zhe  JIANG Xiao  QIAN Sen
Abstract:
Keywords:reinforcement learning  PID control  path planning  obstacle avoidance
点击此处可从《南京航空航天大学学报》浏览原始摘要信息
点击此处可从《南京航空航天大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号