基于MADDPG的多无人机协同任务决策 Multi UAV Cooperative Autonomous Navigation Based on Multi agent Deep Deterministic Policy Gradient期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于MADDPG的多无人机协同任务决策

引用本文：	李波,越凯强,甘志刚,高佩忻.基于MADDPG的多无人机协同任务决策[J].宇航学报,2021,42(6):757-765.

作者姓名：	李波越凯强甘志刚高佩忻

作者单位：	西北工业大学电子信息学院，西安 710114

基金项目：	国家自然科学基金(61573285,62003267);陕西省自然科学基金(2020JQ 220);航空科学基金(2017ZC53021)；数据链技术重点实验室开放基金(CLDL 20182101)

摘要：	针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了MADDPG算法的模型结构。最后通过仿真实验,并对比深度确定性策略梯度(DDPG)算法,验证了本文提出的MADDPG算法在保证精度的基础上,学习速度大幅度提高,弥补了传统强化学习算法在多智能体领域的不足。
关键词：	无人机任务决策深度强化学习策略梯度多智能体
收稿时间：	2020-07-17
Multi UAV Cooperative Autonomous Navigation Based on Multi agent Deep Deterministic Policy Gradient

LI Bo,YUE Kai qiang,GAN Zhi gang,GAO Pei xin.Multi UAV Cooperative Autonomous Navigation Based on Multi agent Deep Deterministic Policy Gradient[J].Journal of Astronautics,2021,42(6):757-765.

Authors:	LI Bo YUE Kai qiang GAN Zhi gang GAO Pei xin

Affiliation:	School of Electronics and Information, Northwestern Polytechnical University, Xi’an 710114, China

Abstract:

Keywords:	UAV Task decision making Deep reinforcement learning Policy gradient Multi agent
本文献已被 CNKI 等数据库收录！
	点击此处可从《宇航学报》浏览原始摘要信息
	点击此处可从《宇航学报》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏