航天器姿态稳定强化学习鲁棒最优控制方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

航天器姿态稳定强化学习鲁棒最优控制方法

引用本文：	肖冰,张海朝.航天器姿态稳定强化学习鲁棒最优控制方法[J].航空学报,2024(1):58-72.

作者姓名：	肖冰张海朝

作者单位：	西北工业大学自动化学院

摘要：	针对外部干扰力矩作用下的刚体航天器姿态稳定最优控制问题，提出了一种在线强化学习的智能鲁棒控制方法。该方法基于自适应动态规划框架，设计单Critic神经网络在线地学习无干扰作用的航天器的最优姿态控制律，并设计一种新的自适应律在线估计Critic神经网络的权值，实现了近似最优的控制性能。在学习的近似最优控制律的基础上，嵌入鲁棒控制量，形成鲁棒智能控制器，并应用Lyapunov理论证明了闭环姿态控制系统是一致最终有界稳定的，且Critic神经网络的权值估计误差是收敛的。相比于采用Actor-Critic神经网络结构的自适应动态规划方法，该方法一方面削弱了对持续激励条件的依赖，另一方面降低了计算复杂度，并保证了姿态稳定控制性能对外部干扰具有较强的鲁棒性。
关键词：	航天器姿态控制强化学习自适应动态规划外部干扰鲁棒性