基于DDQN的运载火箭姿态控制器参数设计 |
| |
引用本文: | 黄旭,柳嘉润,骆无意.基于DDQN的运载火箭姿态控制器参数设计[J].航天控制,2020,38(4):3-8. |
| |
作者姓名: | 黄旭 柳嘉润 骆无意 |
| |
作者单位: | 北京航天自动控制研究所,北京100854;宇航智能控制技术国家级重点实验室,北京100854;北京航天自动控制研究所,北京100854;宇航智能控制技术国家级重点实验室,北京100854;北京航天自动控制研究所,北京100854;宇航智能控制技术国家级重点实验室,北京100854 |
| |
摘 要: | 探索了利用深度强化学习算法训练智能体,以代替人类工程师进行火箭姿态控制器参数的离线设计方案。建立了多特征秒的火箭频域分析模型,选定了设计参数。选择深度强化学习算法中的双深度Q学习(Double Deep Q Network,DDQN)算法,通过记忆回放和时间差分迭代的方式让智能体在与环境交互过程中不断学习。设计了对应的马尔科夫决策过程模型,进行了智能体的训练和前向测试。结果说明该方法对于运载火箭姿控设计具有一定参考价值。
|
关 键 词: | 深度强化学习 姿态控制器 频域分析 参数设计 |
本文献已被 CNKI 万方数据 等数据库收录! |
|