一种深度强化学习制导控制一体化算法 Integrated Guidance and Control for Missile Using Deep Reinforcement Learning期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

一种深度强化学习制导控制一体化算法

引用本文：	裴培,何绍溟,王江,林德福.一种深度强化学习制导控制一体化算法[J].宇航学报,2021,42(10):1293-1304.

作者姓名：	裴培何绍溟王江林德福

作者单位：	1.北京理工大学宇航学院，北京 100081；2. 北京理工大学无人飞行器自主控制研究所，北京 100081

摘要：	研究了一种基于深度强化学习理论的制导控制一体化算法。不同于传统的制导控制一体化算法和制导控制回路分开设计的方法,基于深度强化学习理论的制导控制一体化算法利用深度学习强化算法生成一个智能体,智能体根据导弹的观测量生成舵偏角控制指令准确拦截目标。首先将制导控制问题转化为一个马尔可夫决策过程,然后提出了一个权衡制导精度、能量损耗和飞行时间的奖励函数,将制导控制问题转化到强化学习问题的框架中。最后采用深度确定性策略梯度算法,求解提出的强化学习问题,训练得到制导控制智能体,智能体根据导弹观测量生成舵偏角指令。通过进行大量的数值模拟,验证了提出的制导控制一体化算法的有效性和鲁棒性。
关键词：	制导控制一体化深度强化学习深度确定性策略梯度零控脱靶量启发式学习
收稿时间：	2020-10-19
Integrated Guidance and Control for Missile Using Deep Reinforcement Learning

PEI Pei,HE Shao ming,WANG Jiang,LIN De fu.Integrated Guidance and Control for Missile Using Deep Reinforcement Learning[J].Journal of Astronautics,2021,42(10):1293-1304.

Authors:	PEI Pei HE Shao ming WANG Jiang LIN De fu

Institution:	1. School of Aerospace Engineering, Beijing Institute of Technology, Beijing 100081，China；2. Beijing Key Laboratory of UAV Autonomous Control, Beijing Institute of Technology, Beijing 100081，China

Abstract:

Keywords:	Integrated guidance and control Deep reinforcement learning Deep deterministic policy gradient Zero effort miss Heuristic learning
本文献已被 CNKI 等数据库收录！
	点击此处可从《宇航学报》浏览原始摘要信息
	点击此处可从《宇航学报》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏