基于多智能体混合学习的多星协同动态任务规划算法(英文) 期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于多智能体混合学习的多星协同动态任务规划算法(英文)

作者姓名：	王冲李军景宁王钧陈浩

作者单位：	国防科学技术大学电子科学与工程学院

基金项目：	National High-tech Research and Development Program of China (2007AA120203)

摘要：	针对多星协同动态任务规划问题,以往多采用基于启发式的重规划算法,但是由于启发式策略依赖于具体任务,使得优化性受到影响。注意到协同规划的历史信息对后续协同规划的影响,本文提出了一种基于策略迭代的多智能体强化学习和迁移学习的混合学习算法求解该问题近似最优策略。本文的多智能体强化学习方法利用神经网络描述各颗卫星的强化学习策略,通过协同进化的方法迭代搜索具有最优拓扑结构和连接权重的策略神经网络个体。针对随机出现的观测任务请求导致历史学习策略失效,通过迁移学习将历史学习策略转换为当前初始策略,保证规划质量前提下加快多星协同任务规划速度。仿真实验及分析结果表明本文算法对动态随机出现的任务请求有良好的适应性。
关键词：	多卫星动态任务规划问题多智能体强化学习增量拓扑神经演化算法迁移学习
收稿时间：	2010-12-13
本文献已被 CNKI ScienceDirect 等数据库收录！