一种基于深度强化学习的机动博弈制导律设计方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

一种基于深度强化学习的机动博弈制导律设计方法

引用本文：	朱雅萌,张海瑞,周国峰,梁卓,吕瑞.一种基于深度强化学习的机动博弈制导律设计方法[J].航天控制,2022(3):28-36.

作者姓名：	朱雅萌张海瑞周国峰梁卓吕瑞

作者单位：	中国运载火箭技术研究院

摘要：	针对高速机动飞行器常用的程序化机动突防方式适应性不强、突防效果不稳定的问题，提出了一种基于深度强化学习算法的机动博弈制导方法。该方法以增大交会摆脱量为任务目标，采用深度神经网络拟合飞行器的制导律，应用强化学习方法训练网络参数，得到一种以突防拦截双方的位置和速度为输入、以飞行器的需用过载为输出的智能机动博弈制导律。数学仿真验证结果表明，在连续的状态空间和动作空间中，飞行器能根据当前态势自主选择合适的制导指令。相比传统突防方式，该制导律显著提升了交会摆脱量，且突防效果更稳定。
关键词：	飞行器机动突防交会摆脱量深度强化学习智能制导