一种基于深度强化学习的机动博弈制导律设计方法 |
| |
引用本文: | 朱雅萌,张海瑞,周国峰,梁卓,吕瑞.一种基于深度强化学习的机动博弈制导律设计方法[J].航天控制,2022(3):28-36. |
| |
作者姓名: | 朱雅萌 张海瑞 周国峰 梁卓 吕瑞 |
| |
作者单位: | 中国运载火箭技术研究院 |
| |
摘 要: | 针对高速机动飞行器常用的程序化机动突防方式适应性不强、突防效果不稳定的问题,提出了一种基于深度强化学习算法的机动博弈制导方法。该方法以增大交会摆脱量为任务目标,采用深度神经网络拟合飞行器的制导律,应用强化学习方法训练网络参数,得到一种以突防拦截双方的位置和速度为输入、以飞行器的需用过载为输出的智能机动博弈制导律。数学仿真验证结果表明,在连续的状态空间和动作空间中,飞行器能根据当前态势自主选择合适的制导指令。相比传统突防方式,该制导律显著提升了交会摆脱量,且突防效果更稳定。
|
关 键 词: | 飞行器 机动突防 交会摆脱量 深度强化学习 智能制导 |
|
|