首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于增量式发育深度强化学习的无人机路径规划
引用本文:杨秀霞,王晨蕾,张毅,于浩,姜子劼.基于增量式发育深度强化学习的无人机路径规划[J].飞行力学,2023(3):40-46.
作者姓名:杨秀霞  王晨蕾  张毅  于浩  姜子劼
作者单位:海军航空大学
摘    要:为了克服深度强化学习训练时间长、收敛速度慢的问题,针对密集动态障碍环境下的无人机(UAV)路径规划,引入了增量式发育知识库,对深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)算法进行改进。首先,根据模糊匹配的思想建立威胁模式知识库,将飞行过程中遇到的密集动态障碍作为知识进行增量式存储,避免对相似障碍环境的重复训练。其次,在底层DDPG算法规划安全航路的基础上构建避障策略知识库,根据威胁模式直接输出避障策略,缩短训练时间。最后,搭建发育式的威胁-避障映射关系,实现“线上实时避障,线下自主寻优”,不断提升UAV避障性能。对比实验结果表明,所提方法能极大提高DDPG训练效率,满足UAV在密集动态障碍环境中实时避障的需求。

关 键 词:无人机  DDPG算法  增量式发育知识库  避障
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号