基于DE-MADDPG的多无人机协同追捕策略 |
| |
引用本文: | 符小卫,王辉,徐哲.基于DE-MADDPG的多无人机协同追捕策略[J].航空学报,2022(5):530-543. |
| |
作者姓名: | 符小卫 王辉 徐哲 |
| |
作者单位: | 西北工业大学电子信息学院 |
| |
基金项目: | 航空科学基金(202023053001)~~; |
| |
摘 要: | 针对多无人机协同对抗快速目标的追逃博弈问题,研究了多无人机的协同追捕策略。基于解耦多智能体深度确定性策略梯度算法DE-MADDPG研究了多无人机协同对抗快速目标的追捕策略,设计了多无人机协同追捕的全局奖励和局部奖励两种奖励函数,训练后的多无人机能够有效地执行协同追捕任务。通过设置快速目标的多种逃逸控制策略,仿真验证了所设计的方法能够利用追捕无人机的数量优势,通过协作完成对快速目标的协同围捕,并且通过比较,验证本文所提出的算法相比MADDPG算法更快地取得了收敛效果。
|
关 键 词: | 多无人机 协同追捕 DE-MADDPG 多智能体强化学习 对抗策略 |
|
|