基于深度神经网络的无限时域型航天器追逃策略求解 |
| |
引用本文: | 吴其昌,李彬,李君,张洪波.基于深度神经网络的无限时域型航天器追逃策略求解[J].航天控制,2019,37(6):13-18,58. |
| |
作者姓名: | 吴其昌 李彬 李君 张洪波 |
| |
作者单位: | 国防科技大学空天科学学院,长沙410073;中国运载火箭技术研究院,北京100076 |
| |
摘 要: | 航天器追逃博弈是当前航天领域的一个研究热点,传统上多采用微分对策来获取追逃双方的最优控制策略,但是方法求解复杂、计算量大,难以满足复杂任务和对抗类任务的实时性要求。随着机器学习技术的发展,利用深度神经网络结构实现全部或部分的在线决策成为可能,因此研究了基于深度神经网络生成无限时域型追逃博弈最优控制策略问题。首先基于CW方程建立追逃博弈相对运动模型,采用微分对策理论得到追逃最优控制策略,得到训练数据集和测试数据集;基于TensorFlow环境搭建了4层神经网络,采用Adam优化算法对网络进行训练。仿真结果表明,经过训练的深度神经网络生成的控制策略与传统方法的策略基本一致,虽然长时间追逃的控制差异逐渐增大,但变化趋势相同,说明利用深度神经网络生成航天器追逃博弈的机动策略是有效的。
|
关 键 词: | 深度神经网络 微分对策 追逃博弈 |
本文献已被 CNKI 万方数据 等数据库收录! |
|