首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于强化学习的航天器姿态控制器设计
引用本文:张瑞卿,钟睿,徐毅.基于强化学习的航天器姿态控制器设计[J].上海航天,2023,40(1):80-85.
作者姓名:张瑞卿  钟睿  徐毅
作者单位:北京航空航天大学 宇航学院,北京 102206;上海卫星工程研究所,上海 201109
基金项目:国家自然科学基金(11772023);上海航天科技创新基金(SAST2019-040)
摘    要:航天器在轨执行某些任务时,其质量参数会发生未知变化,传统控制方法在这种情况下控制效果不佳。本文提出基于强化学习的航天器姿态控制器设计方法,该方法在姿态控制器训练过程中不需要对航天器进行动力学建模,不依赖航天器的质量参数。当质量参数发生较大未知变化时,训练好的控制器仍然可以保持较好的控制效果。仿真测试表明:使用基于强化学习方法训练的控制器确实具有良好的鲁棒性。此外,回报函数的设计会明显影响姿态控制器的训练,因此对不同的回报函数设计进行了研究。

关 键 词:航天器姿态控制  鲁棒性  强化学习  神经网络  回报函数
收稿时间:2021/5/20 0:00:00
修稿时间:2021/8/19 0:00:00

Satellite Attitude Control Based on Reinforcement Learning Method
ZHANG Ruiqing,ZHONG Rui,XU Yi.Satellite Attitude Control Based on Reinforcement Learning Method[J].Aerospace Shanghai,2023,40(1):80-85.
Authors:ZHANG Ruiqing  ZHONG Rui  XU Yi
Abstract:
Keywords:attitude control  robustness  reinforcement learning  neural network  reward function
点击此处可从《上海航天》浏览原始摘要信息
点击此处可从《上海航天》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号