首页 | 本学科首页   官方微博 | 高级检索  
     

基于多智能体混合学习的多星协同动态任务规划算法(英文)
作者姓名:王冲  李军  景宁  王钧  陈浩
作者单位:国防科学技术大学电子科学与工程学院
基金项目:National High-tech Research and Development Program of China (2007AA120203)
摘    要:针对多星协同动态任务规划问题,以往多采用基于启发式的重规划算法,但是由于启发式策略依赖于具体任务,使得优化性受到影响。注意到协同规划的历史信息对后续协同规划的影响,本文提出了一种基于策略迭代的多智能体强化学习和迁移学习的混合学习算法求解该问题近似最优策略。本文的多智能体强化学习方法利用神经网络描述各颗卫星的强化学习策略,通过协同进化的方法迭代搜索具有最优拓扑结构和连接权重的策略神经网络个体。针对随机出现的观测任务请求导致历史学习策略失效,通过迁移学习将历史学习策略转换为当前初始策略,保证规划质量前提下加快多星协同任务规划速度。仿真实验及分析结果表明本文算法对动态随机出现的任务请求有良好的适应性。

关 键 词:多卫星动态任务规划问题  多智能体强化学习  增量拓扑神经演化算法  迁移学习
收稿时间:2010-12-13
本文献已被 CNKI ScienceDirect 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号