首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于ADDPG策略的超立方体卫星编队控制
引用本文:苗峻,涂歆滢,殷建丰,彭靖,李海津,陈子匀.基于ADDPG策略的超立方体卫星编队控制[J].中国空间科学技术,2023(4):24-34.
作者姓名:苗峻  涂歆滢  殷建丰  彭靖  李海津  陈子匀
作者单位:1. 中国空间技术研究院钱学森空间技术实验室;2. 中国空间技术研究院北京空间飞行器总体设计部;3. 中国人民解放军66136部队
基金项目:国家自然科学基金(52007007);
摘    要:针对大规模卫星高精度编队控制问题,提出了一种基于吸引法则的深度确定性策略梯度控制方法(attraction-based deep deterministic policy gradient, ADDPG)。首先阐述了超立方体拓扑编队拓扑构型特性,建立了卫星编队动力学模型,设计了超立方体卫星编队虚拟中心用于衡量编队整体飞行状态。为解决无模型深度强化学习的探索和扩展平衡问题,设计了ε-imitation动作选择策略方法,最终提出了基于ADDPG的卫星编队控制策略。算法不依赖于环境模型,通过充分利用已有信息,可以降低学习模型初期探索过程中的盲目试错。仿真结果表明ADDPG策略以较少的能量消耗达到更高的精度,相比知名算法在加快编队收敛速度的同时,误差减少5%以上,能量消耗减少7%以上,验证了算法的有效性。

关 键 词:ADDPG策略  虚拟中心  超立方体拓扑结构  卫星编队  深度强化学习
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号