首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于深度强化学习的机动博弈制导律设计方法
引用本文:朱雅萌,张海瑞,周国峰,梁卓,吕瑞.一种基于深度强化学习的机动博弈制导律设计方法[J].航天控制,2022(3):28-36.
作者姓名:朱雅萌  张海瑞  周国峰  梁卓  吕瑞
作者单位:中国运载火箭技术研究院
摘    要:针对高速机动飞行器常用的程序化机动突防方式适应性不强、突防效果不稳定的问题,提出了一种基于深度强化学习算法的机动博弈制导方法。该方法以增大交会摆脱量为任务目标,采用深度神经网络拟合飞行器的制导律,应用强化学习方法训练网络参数,得到一种以突防拦截双方的位置和速度为输入、以飞行器的需用过载为输出的智能机动博弈制导律。数学仿真验证结果表明,在连续的状态空间和动作空间中,飞行器能根据当前态势自主选择合适的制导指令。相比传统突防方式,该制导律显著提升了交会摆脱量,且突防效果更稳定。

关 键 词:飞行器  机动突防  交会摆脱量  深度强化学习  智能制导
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号