基于ADDPG策略的超立方体卫星编队控制 |
| |
引用本文: | 苗峻,涂歆滢,殷建丰,彭靖,李海津,陈子匀.基于ADDPG策略的超立方体卫星编队控制[J].中国空间科学技术,2023(4):24-34. |
| |
作者姓名: | 苗峻 涂歆滢 殷建丰 彭靖 李海津 陈子匀 |
| |
作者单位: | 1. 中国空间技术研究院钱学森空间技术实验室;2. 中国空间技术研究院北京空间飞行器总体设计部;3. 中国人民解放军66136部队 |
| |
基金项目: | 国家自然科学基金(52007007); |
| |
摘 要: | 针对大规模卫星高精度编队控制问题,提出了一种基于吸引法则的深度确定性策略梯度控制方法(attraction-based deep deterministic policy gradient, ADDPG)。首先阐述了超立方体拓扑编队拓扑构型特性,建立了卫星编队动力学模型,设计了超立方体卫星编队虚拟中心用于衡量编队整体飞行状态。为解决无模型深度强化学习的探索和扩展平衡问题,设计了ε-imitation动作选择策略方法,最终提出了基于ADDPG的卫星编队控制策略。算法不依赖于环境模型,通过充分利用已有信息,可以降低学习模型初期探索过程中的盲目试错。仿真结果表明ADDPG策略以较少的能量消耗达到更高的精度,相比知名算法在加快编队收敛速度的同时,误差减少5%以上,能量消耗减少7%以上,验证了算法的有效性。
|
关 键 词: | ADDPG策略 虚拟中心 超立方体拓扑结构 卫星编队 深度强化学习 |
|
|