排序方式: 共有48条查询结果,搜索用时 15 毫秒
11.
元强化学习是指自动从一组相关任务中学习强化学习所需归纳偏置的相关理论和方法,对于提高强化学习算法在困难场景下的样本效率和泛化能力具有重要用途。本文提出一种新的元强化学习框架,指出设计和分析一个元强化学习算法需要同时考虑学习经验(相关任务)、归纳偏置及学习目标3个独立因素及这3个因素之间的依赖关系。在此基础上对该领域的研究现状进行了分析和总结,特别对近年来元强化学习若干文献进行了分析和归类,并详细阐述了几种代表性算法的原理及各自特点。本文还对元强化学习常用的实验环境和性能评价方法进行了介绍,对该领域的不足和未来的发展方向进行了讨论和分析。 相似文献
12.
在已有的航天器发射过程中,火箭是很大的一笔一次性开销,因为火箭升空的过程就是自我牺牲的过程。一次航天发射任务之后,火箭只剩下几乎没有多少再利用价值的残骸。美国一家民用太空公司决定改变火箭的命运,它们开发出世界上第一款可以重复利用的火箭。目前,这款火箭已经成功完成两次短距离试飞。 相似文献
13.
14.
15.
左晓阳 《航空标准化与质量》2002,(6):36-39
根据原国防科工委颁发的《武器装备研制的标准化工作规定》的要求 ,概述了型号标准化的组织机构、工作目标及工作任务 ;介绍了在某重点型号研制中开展标准化工作的实践体会。 相似文献
16.
17.
18.
19.
20.