基于多智能体强化学习的轨道追逃博弈方法 Method for Cluster Satellite Orbit Pursuit-Evasion Game Based on Multi-agent Deep Deterministic Policy Gradient Algorithm期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于多智能体强化学习的轨道追逃博弈方法

引用本文：	许旭升,党朝辉,宋斌,袁秋帆,肖余之.基于多智能体强化学习的轨道追逃博弈方法[J].上海航天,2022,39(2):24-31.

作者姓名：	许旭升党朝辉宋斌袁秋帆肖余之

作者单位：	上海宇航系统工程研究所，上海201109;西北工业大学航天学院，陕西西安710109

摘要：	针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协调等问题,提出一种基于多智能体深度强化学习算法的集群卫星空间轨道追逃博弈方法.首先通过对博弈场景进行建模,在考虑最短时间、最优燃料以及碰撞规避的情形下进行奖励函数的塑造和改进,利用深度强化学习方法中的...
关键词：	集群卫星非合作目标追逃博弈奖励塑造多智能体深度确定性策略梯度算法涌现智能
收稿时间：	2021/11/18 0:00:00
修稿时间：	2022/1/30 0:00:00
Method for Cluster Satellite Orbit Pursuit-Evasion Game Based on Multi-agent Deep Deterministic Policy Gradient Algorithm

XU Xusheng,DANG Zhaohui,SONG Bin,YUAN Qiufan,XIAO Yuzhi.Method for Cluster Satellite Orbit Pursuit-Evasion Game Based on Multi-agent Deep Deterministic Policy Gradient Algorithm[J].Aerospace Shanghai,2022,39(2):24-31.

Authors:	XU Xusheng DANG Zhaohui SONG Bin YUAN Qiufan XIAO Yuzhi

Abstract:

Keywords:	cluster satellite non-cooperative target pursuit-evasion game reward shaping multi-agent deep deterministic policy gradient (MADDPG) algorithm emergence intelligence

	点击此处可从《上海航天》浏览原始摘要信息
	点击此处可从《上海航天》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏