首页 | 本学科首页   官方微博 | 高级检索  
     检索      

航天器姿态稳定强化学习鲁棒最优控制方法
引用本文:肖冰,张海朝.航天器姿态稳定强化学习鲁棒最优控制方法[J].航空学报,2024(1):58-72.
作者姓名:肖冰  张海朝
作者单位:西北工业大学自动化学院
摘    要:针对外部干扰力矩作用下的刚体航天器姿态稳定最优控制问题,提出了一种在线强化学习的智能鲁棒控制方法。该方法基于自适应动态规划框架,设计单Critic神经网络在线地学习无干扰作用的航天器的最优姿态控制律,并设计一种新的自适应律在线估计Critic神经网络的权值,实现了近似最优的控制性能。在学习的近似最优控制律的基础上,嵌入鲁棒控制量,形成鲁棒智能控制器,并应用Lyapunov理论证明了闭环姿态控制系统是一致最终有界稳定的,且Critic神经网络的权值估计误差是收敛的。相比于采用Actor-Critic神经网络结构的自适应动态规划方法,该方法一方面削弱了对持续激励条件的依赖,另一方面降低了计算复杂度,并保证了姿态稳定控制性能对外部干扰具有较强的鲁棒性。

关 键 词:航天器  姿态控制  强化学习  自适应动态规划  外部干扰  鲁棒性
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号