基于D3QN的无人机编队控制技术 |
| |
引用本文: | 赵启,甄子洋,龚华军,曹红波,李荣,刘继承.基于D3QN的无人机编队控制技术[J].北京航空航天大学学报,2023(8):2137-2146. |
| |
作者姓名: | 赵启 甄子洋 龚华军 曹红波 李荣 刘继承 |
| |
作者单位: | 南京航空航天大学自动化学院 |
| |
基金项目: | 国家自然科学基金(61973158); |
| |
摘 要: | 针对无人机编队中控制器设计需要基于模型信息,以及无人机智能化程度低等问题,采用深度强化学习解决编队控制问题。针对编队控制问题设计对应强化学习要素,并设计基于深度强化学习对偶双重深度Q网络(D3QN)算法的编队控制器,同时提出一种优先选择策略与多层动作库结合的方法,加快算法收敛速度并使僚机最终能够保持到期望距离。通过仿真将设计的控制器与PID控制器、Backstepping控制器对比,验证D3QN控制器的有效性。仿真结果表明:该控制器可应用于无人机编队,提高僚机智能化程度,自主学习保持到期望距离,且控制器设计无需模型精确信息,为无人机编队智能化控制提供了依据与参考。
|
关 键 词: | 无人机编队 编队控制 深度强化学习 深度Q网络 对偶双重深度Q网络 |
|
|