首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种深度强化学习制导控制一体化算法
引用本文:裴培,何绍溟,王江,林德福.一种深度强化学习制导控制一体化算法[J].宇航学报,2021,42(10):1293-1304.
作者姓名:裴培  何绍溟  王江  林德福
作者单位:1.北京理工大学宇航学院,北京 100081;2. 北京理工大学无人飞行器自主控制研究所,北京 100081
摘    要:研究了一种基于深度强化学习理论的制导控制一体化算法。不同于传统的制导控制一体化算法和制导控制回路分开设计的方法,基于深度强化学习理论的制导控制一体化算法利用深度学习强化算法生成一个智能体,智能体根据导弹的观测量生成舵偏角控制指令准确拦截目标。首先将制导控制问题转化为一个马尔可夫决策过程,然后提出了一个权衡制导精度、能量损耗和飞行时间的奖励函数,将制导控制问题转化到强化学习问题的框架中。最后采用深度确定性策略梯度算法,求解提出的强化学习问题,训练得到制导控制智能体,智能体根据导弹观测量生成舵偏角指令。通过进行大量的数值模拟,验证了提出的制导控制一体化算法的有效性和鲁棒性。

关 键 词:制导控制一体化  深度强化学习  深度确定性策略梯度  零控脱靶量  启发式学习  
收稿时间:2020-10-19

Integrated Guidance and Control for Missile Using Deep Reinforcement Learning
PEI Pei,HE Shao ming,WANG Jiang,LIN De fu.Integrated Guidance and Control for Missile Using Deep Reinforcement Learning[J].Journal of Astronautics,2021,42(10):1293-1304.
Authors:PEI Pei  HE Shao ming  WANG Jiang  LIN De fu
Institution:1. School of Aerospace Engineering, Beijing Institute of Technology, Beijing 100081,China;2. Beijing Key Laboratory of UAV Autonomous Control, Beijing Institute of Technology, Beijing 100081,China
Abstract:
Keywords:Integrated guidance and control  Deep reinforcement learning  Deep deterministic policy gradient  Zero effort miss  Heuristic learning    
本文献已被 CNKI 等数据库收录!
点击此处可从《宇航学报》浏览原始摘要信息
点击此处可从《宇航学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号