首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于多智能体强化学习的轨道追逃博弈方法
引用本文:许旭升,党朝辉,宋斌,袁秋帆,肖余之.基于多智能体强化学习的轨道追逃博弈方法[J].上海航天,2022,39(2):24-31.
作者姓名:许旭升  党朝辉  宋斌  袁秋帆  肖余之
作者单位:上海宇航系统工程研究所,上海201109;西北工业大学 航天学院,陕西 西安710109
摘    要:针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协调等问题,提出一种基于多智能体深度强化学习算法的集群卫星空间轨道追逃博弈方法.首先通过对博弈场景进行建模,在考虑最短时间、最优燃料以及碰撞规避的情形下进行奖励函数的塑造和改进,利用深度强化学习方法中的...

关 键 词:集群卫星  非合作目标  追逃博弈  奖励塑造  多智能体深度确定性策略梯度算法  涌现  智能
收稿时间:2021/11/18 0:00:00
修稿时间:2022/1/30 0:00:00

Method for Cluster Satellite Orbit Pursuit-Evasion Game Based on Multi-agent Deep Deterministic Policy Gradient Algorithm
XU Xusheng,DANG Zhaohui,SONG Bin,YUAN Qiufan,XIAO Yuzhi.Method for Cluster Satellite Orbit Pursuit-Evasion Game Based on Multi-agent Deep Deterministic Policy Gradient Algorithm[J].Aerospace Shanghai,2022,39(2):24-31.
Authors:XU Xusheng  DANG Zhaohui  SONG Bin  YUAN Qiufan  XIAO Yuzhi
Abstract:
Keywords:cluster satellite  non-cooperative target  pursuit-evasion game  reward shaping  multi-agent deep deterministic policy gradient (MADDPG) algorithm  emergence  intelligence
点击此处可从《上海航天》浏览原始摘要信息
点击此处可从《上海航天》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号