基于强化学习的多智能体系统目标围捕控制期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于强化学习的多智能体系统目标围捕控制

引用本文：	范之琳,杨洪勇,韩艺琳.基于强化学习的多智能体系统目标围捕控制[J].航空学报,2023(S1):236-245.

作者姓名：	范之琳杨洪勇韩艺琳

作者单位：	鲁东大学信息与电气工程学院

基金项目：	国家自然科学基金（61673200）；

摘要：	针对多智能体系统目标围捕问题，提出了基于强化学习的目标围捕控制方法。首先，对多智能体系统进行马尔可夫博弈建模，设计能够控制系统到期望围捕状态并满足避障要求的势能函数，将模型控制与强化学习原理结合，利用势能模型引导的改进多智能体强化学习算法进行围捕。其次，在已有势能模型的基础上建立跟踪围捕和环航围捕2种围捕策略。前者通过设计速度势能函数实现多智能体一致跟踪。后者加入虚拟环航点，设计虚拟环航点势能函数实现期望环航。最终，仿真验证了多智能体强化学习围捕控制策略的有效性。
关键词：	目标围捕强化学习势能函数多智能体系统避障