首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于强化学习的多智能体系统目标围捕控制
引用本文:范之琳,杨洪勇,韩艺琳.基于强化学习的多智能体系统目标围捕控制[J].航空学报,2023(S1):236-245.
作者姓名:范之琳  杨洪勇  韩艺琳
作者单位:鲁东大学信息与电气工程学院
基金项目:国家自然科学基金(61673200);
摘    要:针对多智能体系统目标围捕问题,提出了基于强化学习的目标围捕控制方法。首先,对多智能体系统进行马尔可夫博弈建模,设计能够控制系统到期望围捕状态并满足避障要求的势能函数,将模型控制与强化学习原理结合,利用势能模型引导的改进多智能体强化学习算法进行围捕。其次,在已有势能模型的基础上建立跟踪围捕和环航围捕2种围捕策略。前者通过设计速度势能函数实现多智能体一致跟踪。后者加入虚拟环航点,设计虚拟环航点势能函数实现期望环航。最终,仿真验证了多智能体强化学习围捕控制策略的有效性。

关 键 词:目标围捕  强化学习  势能函数  多智能体系统  避障
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号