首页 | 本学科首页   官方微博 | 高级检索  
     

攻击角度约束下的分布式强化学习制导方法
作者姓名:李博皓  安旭曼  杨晓飞  吴云洁  李国飞
作者单位:1. 北京航空航天大学虚拟现实技术与系统国家重点实验室,北京 100191;2. 北京航空航天大学大学自动化科学与电气工程学院,北京 100191;3. 飞行器控制一体化技术重点实验室,北京 100191;4. 西北工业大学航天学院,西安 710072
基金项目:国家自然科学基金(62003021);中央高校基本科研业务项目(D5000210830)
摘    要:为提高导弹在攻击角度约束下对目标的打击效能,提出了一种基于深度确定性策略梯度算法的分布式强化学习制导策略。为了最大限度地减小攻击角度误差,设计了一种新的奖励函数,使导弹在满足视场角约束的同时,视线角向期望值收敛。此外,为了增强强化学习模型的泛化能力,提出了一种分布式探索策略,提高了模型训练过程中对环境的探索效率。仿真结果验证了所提出的分布式强化学习制导方法能够在固定攻击角度约束下实现对目标的精准打击。与传统制导律相比,所提制导方法的攻击角度误差更小,收敛速度更快。

关 键 词:导弹制导  强化学习  攻击角度  梯度算法  
收稿时间:2021-12-31
点击此处可从《宇航学报》浏览原始摘要信息
点击此处可从《宇航学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号