首页 | 本学科首页   官方微博 | 高级检索  
     

针对超临界翼型气动修型策略的强化学习
作者姓名:李润泽  张宇飞  陈海昕
作者单位:清华大学航天航空学院,北京 100084
基金项目:国家自然科学基金(11872230,91852108);清华自主创新科研基金(2015Z22003)
摘    要:强化学习是一类用于学习策略的机器学习方法,通过模拟人的学习过程,与所处环境不断交互来学习动作策略,用以获得最大累积回报。以设计师在翼型气动设计中的增量修型过程为例,给出强化学习在气动优化设计中的要素定义和具体算法的实现。研究了预训练中选择不同示例对预训练和强化学习结果的影响,并将强化学习得到的策略模型在其他环境中进行了迁移测试验证。结果表明,合理的预训练能够有效提高强化学习的效率和最终策略的鲁棒性,且所形成的策略模型具有较好的迁移能力。

关 键 词:强化学习  增量修型  近端策略优化(PPO)  预训练  模仿学习  迁移能力
收稿时间:2020-01-08
修稿时间:2020-02-01
本文献已被 万方数据 等数据库收录!
点击此处可从《航空学报》浏览原始摘要信息
点击此处可从《航空学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号