首页 | 官方网站   微博 | 高级检索  
     

基于MADDPG的多无人机协同任务决策
引用本文:李波,越凯强,甘志刚,高佩忻.基于MADDPG的多无人机协同任务决策[J].宇航学报,2021,42(6):757-765.
作者姓名:李波  越凯强  甘志刚  高佩忻
作者单位:西北工业大学电子信息学院,西安 710114
基金项目:国家自然科学基金(61573285,62003267);陕西省自然科学基金(2020JQ 220);航空科学基金(2017ZC53021);数据链技术重点实验室开放基金(CLDL 20182101)
摘    要:针对多无人机任务决策方法研究中传统优化算法难以在短时间内得到期望结果的问题,基于深度强化学习提出一种无人机多智能体深度确定性策略梯度(MADDPG)算法,通过允许无人机在学习时使用全局信息,在应用决策的时候只使用局部信息的方法,从网络结构、状态空间、动作空间和奖励函数设计了MADDPG算法的模型结构。最后通过仿真实验,并对比深度确定性策略梯度(DDPG)算法,验证了本文提出的MADDPG算法在保证精度的基础上,学习速度大幅度提高,弥补了传统强化学习算法在多智能体领域的不足。

关 键 词:无人机  任务决策  深度强化学习  策略梯度  多智能体  
收稿时间:2020-07-17

Multi UAV Cooperative Autonomous Navigation Based on Multi agent Deep Deterministic Policy Gradient
LI Bo,YUE Kai qiang,GAN Zhi gang,GAO Pei xin.Multi UAV Cooperative Autonomous Navigation Based on Multi agent Deep Deterministic Policy Gradient[J].Journal of Astronautics,2021,42(6):757-765.
Authors:LI Bo  YUE Kai qiang  GAN Zhi gang  GAO Pei xin
Affiliation:School of Electronics and Information, Northwestern Polytechnical University, Xi’an 710114, China
Abstract:
Keywords:UAV  Task decision making  Deep reinforcement learning  Policy gradient  Multi agent  
本文献已被 CNKI 等数据库收录!
点击此处可从《宇航学报》浏览原始摘要信息
点击此处可从《宇航学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号