期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	1篇
免费	0篇

专业分类

航空

1篇

出版年

2006年

1篇

排序方式： 共有1条查询结果，搜索用时 5 毫秒

基于探索区域扩张策略的Q-学习算法

胡丹丹贺振东刘洁高庆吉《中国民航学院学报》2006,24(1):32-35

针对Q-学习算法中探索与利用之间的平衡问题，在基于Metropolis准则的Q-学习的基础上，提出了基于探索区域扩张策略的Q-学习改进算法。消除了初始时刻在整个环境中加入探索的盲目性。提高了学习效率。通过加入算法的自主学习结束条件，避免了找到最优路径后的重复学习，节省了学习时间。仿真实验证明了该算法的有效性。相似文献