首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 16 毫秒
1.
针对Q-学习算法中探索与利用之间的平衡问题,在基于Metropolis准则的Q-学习的基础上,提出了基于探索区域扩张策略的Q-学习改进算法。消除了初始时刻在整个环境中加入探索的盲目性。提高了学习效率。通过加入算法的自主学习结束条件,避免了找到最优路径后的重复学习,节省了学习时间。仿真实验证明了该算法的有效性。  相似文献   

2.
李红光  王菲  丁文锐 《航空学报》2022,43(1):205-220
多任务学习(MTL)可以在训练中联合利用多个任务的监督信号,并通过共享多个相关任务之间的有用信息来提升模型性能。本文从目标分类识别应用角度,全面梳理和分析了多任务学习的机制及其主流方法。首先,对多任务学习的定义、原理和方法进行阐述。其次,以应用较为广泛、具有代表性且具有共性特点的细粒度分类和目标重识别为例,重点介绍多任务学习机制在目标分类和识别任务应用的2类方法:基于任务层的多任务学习和基于特征层的多任务学习,并针对每种类型进一步分类分析不同的多任务学习算法的设计思想和优缺点。接着,对本文综述的各种多任务学习算法在通用数据集上开展性能对比。最后,对面向目标分类和识别任务的多任务学习方法的未来趋势进行展望。  相似文献   

3.
通过对传统学习环境概念的阐释以及对一些有代表意义的建构主义学习环境定义的分析,提出关于建构主义学习环境的概念及其基本特点,论述了建构主义学习环境设计与教学设计之间的区别,建构主义学习环境的本质和设计过程中应注意的问题。  相似文献   

4.
宋闯  赵佳佳  王康  梁欣凯 《航空学报》2020,41(z1):723756-723756
小样本学习指只利用目标类别的少量监督信息来训练机器学习模型。由于其实用价值,学术界和工业界提出很多针对该问题的解决方案,但是目前国内缺少该问题的综述。本文对国内外学者提出的小样本学习算法及基于小样本学习的目标检测算法进行了系统的总结和探索。首先,给出了小样本学习的问题定义,列举其与其他一些经典的机器学习问题之间的联系,同时从理论上阐述小样本学习问题面临的挑战;接着,对基于小样本学习的图像分类进行了概述,并对其中代表性的工作进行介绍与分析;在此基础上,重点针对基于小样本学习的目标检测,特别是零样本条件下的目标检测问题,详细介绍和分析了现有的研究工作;最后,立足于现有方法的优缺点,从问题设定、理论研究、实现技术以及应用场景等几个方面对小样本学习的未来发展进行了展望,期望为该领域后续的研究工作提供启示。  相似文献   

5.
研究性学习成为当前数学教育研究中的一个热点,也是当代建构主义学习理论与教学实践紧密结合的重要表现。高等数学系列课程的研究性学习因其重要意义同样成为高等教育中的一个不可忽视的问题,学生要开展研究性学习,这就决定了教师必须进行研究性教学。  相似文献   

6.
非对称机动能力多无人机智能协同攻防对抗   总被引:1,自引:0,他引:1  
陈灿  莫雳  郑多  程子恒  林德福 《航空学报》2020,41(12):324152-324152
协同攻防对抗是未来军用无人机的重要作战场景。针对不同机动能力无人机群体间的攻防对抗问题,建立了多无人机协同攻防演化模型,基于多智能体强化学习理论,研究了多无人机协同攻防的自主决策方法,提出了基于执行-评判(Actor-Critic)算法的集中式评判和分布式执行的算法结构,保证算法稳定收敛的同时,提升执行效率。无人机的评判模块使用全局信息评价决策优劣引导策略学习,而执行时只需要依赖局部感知信息进行自主决策,提高了多机攻防对抗的效能。仿真结果表明,所提的多无人机强化学习方法具备较强的自进化属性,赋予了无人机一定智能,即稳定的自主学习能力,通过不断演化,能自主学习提升协同对抗的决策效能。  相似文献   

7.
影响民航维修企业在职培训效果均因素及其改善对策   总被引:1,自引:0,他引:1  
民航维修业是高科技、高风险的行业,航空维修企业是知识密集、技术密集型的组织。航空科技的发展日新月异,只有加强学习,不断汲取新的知识,才能跟上时代发展的要求,在职培训是企业员工学习的有效方法。维修企业只有在制度上鼓励学习,加强在职培训,将组织发展成为学习型组织,才能满足民航运输业持续发展的要求。  相似文献   

8.
协作学习质量评价指标体系和方法研究   总被引:2,自引:0,他引:2  
协作学习小组活动质量的合理评价是远程开放教育教学管理的一个难点。它关系到协作学习小组活动的规范化和开展活动的动力支持,关系到学员协作学习能力和自主学习能力的培养。文章结合基层电大教学实际,探索了协作学习小组活动质量综合评估的方法,即从指标设计、同度量处理、权重的确定、综合评分到质量的优劣排序的一套完整的操作程序和方法。特别是统计分析软件的应用,有利于我们分析水平的提高。同时,对远程开放教育其他方面的教学质量综合评估有一定的借鉴作用。  相似文献   

9.
数学学习倦怠在职业院校学生是较为普遍地一个现象,这除了学生自身的有关原因外,数学教学自身也存在着许多有待改进的问题,树立学生学习信心,激发兴趣以及提高课堂教学艺术都是数学教师解决学生学习倦怠的有效办法。  相似文献   

10.
张堃  李珂  邹杰  栗鸣  李阳 《航空科学技术》2023,(11):103-110
针对无人机精确投放引导问题,本文提出基于深度迁移强化学习的无人机投放自主引导机动控制算法,分别建立基于马尔可夫决策过程的引导机动决策模型、引导机动评估模型等,并设计基于迁移学习和课程学习的引导机动策略训练方法,拟合基于深度学习的引导机动策略和评估网络,最后开展仿真训练和验证试验。仿真结果表明,该算法实现了无人机在任意姿态和位置条件下,能够自主规避区域威胁并自主引导至目标投放点,成功完成投放瞄准任务,有效地提升了无人机投放引导机动控制的自主性。  相似文献   

11.
近几年,由于高校招生数量的大幅度增加,高等教育也从精英型向大众普及型转化。一般院校学生入学时的数学总体水平有较明显的降低,学习自觉性,积极性不足,缺少较好的学习方法,缺少学好数学的信心。因此高校数学教育的改革势在必行。从目前学生学习现状,大学数学教学中存在的新问题,高校数学课程设置的缺欠等几个方面讨论了高校开设数学文化课的重要性。  相似文献   

12.
将深度强化学习方法应用于水洞实验,实现了实验室内的自动闭环优化框架,并用该框架优化了雷诺数Re=1.3×104下纯俯仰运动的NACA0012翼型模型的推进效率。现有的相关研究往往将运动模式限制为某种周期性函数,具有局限性。借助于强化学习方法,实现了在更广的非周期动作空间中的动作搜索。在实验中,模型自动地与水洞环境进行交互,最终学习到了高效推进的非周期运动策略。另外,通过修改奖励函数,实现了在给定推力阈值以上的效率优化。研究结果显示,强化学习模型可以在实验过程中通过不断调整拍动动作的幅度和频率来实现推进效率的持续提升,并且最终通过强化学习方法获得的最优拍动动作均与正弦拍动动作接近,得到的最优推进效率基本位于同等幅度正弦动作效率的上边界。研究展示了强化学习方法用于复杂流动控制问题的可行性。  相似文献   

13.
随着人工智能技术的发展,智能航空发动机逐渐成为当今航空领域研究的热点。传统的航空发动机控制对发动机模型的依赖性过强,而基于发动机气热动力学公式的机理建模会引入较大的建模误差,给控制器设计带来困难。对此,提出一种基于强化学习的航空发动机控制虚拟自学习方法,首先利用航空发动机的试验数据通过LSTM 神经网络建立虚拟学习环境,然后采用深度强化学习TD3 算法,在虚拟环境中训练智能控制器,最后采用JT9D 发动机模型验证智能控制器的性能。结果表明:相比于传统PID 控制,智能控制器产生的超调量更小,调节时间更短。  相似文献   

14.
随着工业化进程的迅猛发展,产生了大量的图像信息,传统的图像识别技术难以处理如此庞大的图像数据以及满足速度和精度上的要求,大数据及深度学习技术应运而生,基于卷积神经网络的图像识别方法成为目前图像识别的主流算法。文中首先介绍了传统图像识别技术及存在的问题,引入了卷积神经网络的深度学习方法,重点说明了卷积网络中间层的结构和特点,然后介绍图像识别中经典的卷积神经网络模型及相互间的区别,最后简要综述卷积神经网络在图像识别中的应用,指出了有监督的卷积网络学习缺点及无监督学习的研究方向。  相似文献   

15.
BP算法因收敛速度慢、易于陷入局部极小值等缺点,使得对于较大的搜索空间、多峰值和不可微函数常常不能搜索到全局极小点,这些制约了BP网络在各个领域中的应用。本文通过对学习系数、神经元的激励函数及误差函数的联合优化,在一定程度上避免了学习中的局部极小问题,提高了学习效率,改进了网络的性能。  相似文献   

16.
在空、天、海等复杂环境下的目标识别任务中,高质量的样本数据往往较少。特别是在干扰对抗环境下,某些特定领域的目标信息获取困难,可靠的标注数据较少。小样本问题对深度学习技术在目标识别任务中的应用提出了新的挑战。迁移学习为小样本不确定环境下的目标识别问题提供了新的研究思路。本文针对小样本目标问题,以机载雷达等空天传感器信息对海面目标识别为例,介绍了迁移学习的主要思路和方法,对迁移学习在海面目标识别问题中的应用现状进展进行了总结;分析和归纳了迁移学习在海面目标识别应用中的主要挑战。最后对可解释性及鲁棒性的海洋目标识别技术需求及未来发展方向进行了展望。  相似文献   

17.
逆传播神经网络算法是人工神经网络用于非线性预测的主要学习算法。它具有思路清晰,结构严谨,操作性强等特点,但同时也存在预测精度低,收敛速度慢等问题,本文从神经网络模型的结构出发,对学习算法提出了一系列改进和优化措施,以加快网络的学习速度,并增加模型的稳定性。  相似文献   

18.
针对多智能体系统目标围捕问题,提出了基于强化学习的目标围捕控制方法。首先,对多智能体系统进行马尔可夫博弈建模,设计能够控制系统到期望围捕状态并满足避障要求的势能函数,将模型控制与强化学习原理结合,利用势能模型引导的改进多智能体强化学习算法进行围捕。其次,在已有势能模型的基础上建立跟踪围捕和环航围捕2种围捕策略。前者通过设计速度势能函数实现多智能体一致跟踪。后者加入虚拟环航点,设计虚拟环航点势能函数实现期望环航。最终,仿真验证了多智能体强化学习围捕控制策略的有效性。  相似文献   

19.
学习型组织理论是世界上最前沿的两大管理理论之一,创建学习型工会是提高职工素质、学校自身发展、履行工会自身职责覆提高决策民主化的需要。工会要从树立新的学习观,建立新的学习举措,构建行之有效的运行机制出发,创建学习型工会组织。  相似文献   

20.
“兴趣是最好的老师。”培养学生的学习兴趣、提高教学质量一直是英语教学改革的重点。本文从因材施教,逐步探索适合我院学生的英语教学模式,强调能力的培养,创新英语课堂教学、做学生的良师益友,充分调动学生学习英语的积极性等三方面对这一问题加以论述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号