首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 922 毫秒
1.
针对边缘网络环境下多人机之间存在计算负载不均,造成卸载任务失败的问题,提出了一种多无人机间协作的智能任务卸载方案。通过联合考虑多无人机任务分配、计算资源分配和无人机飞行轨迹,引入公平性指数建立了无人机公平负载最大化和能量消耗最小化问题。基于多智能体深度强化学习框架,提出了融合轨迹规划和任务卸载的分布式算法。仿真结果表明,所提出的多无人机协作方案可以显著提高任务完成率和负载公平度,并且有效适用于大规模用户设备场景。  相似文献   

2.
元强化学习是指自动从一组相关任务中学习强化学习所需归纳偏置的相关理论和方法,对于提高强化学习算法在困难场景下的样本效率和泛化能力具有重要用途。本文提出一种新的元强化学习框架,指出设计和分析一个元强化学习算法需要同时考虑学习经验(相关任务)、归纳偏置及学习目标3个独立因素及这3个因素之间的依赖关系。在此基础上对该领域的研究现状进行了分析和总结,特别对近年来元强化学习若干文献进行了分析和归类,并详细阐述了几种代表性算法的原理及各自特点。本文还对元强化学习常用的实验环境和性能评价方法进行了介绍,对该领域的不足和未来的发展方向进行了讨论和分析。  相似文献   

3.
针对带有输入时滞和外部干扰的集群无人机系统,提出了一种基于强化学习的集群无人机事件触发分布式自适应最优控制方法。为了实现最优控制,引入了基于神经网络的强化学习算法,并设计了一种与系统控制性能有关的动态事件触发策略,该策略可以在尽可能降低对一致性控制性能不利影响的前提下,减少通信资源的浪费,同时该策略不存在Zeno行为。此外,在控制器设计过程中,引入了一种含有积分项的坐标变换来处理系统的输入时滞问题。在输入时滞和外部干扰的影响下,所提出的基于干扰观测器的最优分布式协同神经网络控制策略能够保证每个无人机系统所有信号都有界,并且每个无人机系统的输出能够实现一致性。最后,仿真结果验证了所提控制方法的有效性。  相似文献   

4.
针对未知环境下的移动机器人导航问题,本文提出了一种基于分层式强化学习的混合式控制方法。利用栅格-拓扑相结合的环境表示及地图学习方法,通过分层式强化学习在不同控制层次的扩展设计移动机器人的反应式和慎思式导航控制,实现了全局导航和局部导航控制的协调优化。实验及测试结果证明,该控制方法能实现导航任务的全局优化,避免陷入局部极小,并对未知动态环境具有较强的适应性。  相似文献   

5.
针对空海联合作战中多装备复杂作战场景不确定性高的难点,提出了一种基于深度强化学习的空海联合作战智能决策新方法。为了统一表示复杂网络的输入、输出及其对应关系,提出了综合利用感知机、深度长短时记忆网络及actor-critic结构的方法。针对策略网络学习过程中的不稳定性及近似策略优化算法的缺陷,提出了改进的近似策略优化算法;针对策略网络自学习过程中对手策略的易变性,提出了基于模型性能和模型多样性的新策略以对于基线策略模型进行选择。实验结果表明,该方法在空海联合作战决策中是有效和稳定的。在第四届中国指控学会兵棋推演专项赛中,本方法在百余轮与规则决策算法及人类的对抗中胜率达到97%,较规则决策算法提升20%左右。  相似文献   

6.
针对机器人在动态复杂环境下的操作问题,研究机械臂跟踪运动目标及避障的运动控制方法。采用传统PID控制方法与DDPG强化学习算法相结合的方式,利用PID控制使得机械臂的工作平面快速接近目标物并与之重合,再使用DDPG算法让机械臂在平面内自主学习追踪目标物投影同时避开障碍物投影,最终在三维空间中实现跟踪与避障。该方法将机械臂作为一个智能体,智能体通过感知目标物和障碍物的距离偏差来自主学习避障跟踪策略。将本方法用于多自由度机械臂路径规划与避障任务中,对比单纯使用DDPG算法将机械臂作为智能体在空间中进行决策控制,仿真结果显示本文所提出的方法收敛效果和控制性能更好,机械臂能在训练后实现目标物的稳定跟踪和障碍物的躲避。  相似文献   

7.
混合采样数据不仅仅具有不同采样频率数据之间特征集合不同,还有样本数量不一致等特点,传统的分类方法不能直接使用。因此,本文提出一种基于Fisher判别准则字典学习的混合采样数据分类方法以处理采样数据的分类任务。该模型巧妙借助处理多视图数据的分类思想,利用基于Fisher判别准则的字典学习方法,生成的结构化字典的每个原子与数据的类标签相关,同时采用Fisher判别准则使类内散度更小,类间散度更大来约束编码系数矩阵,从而大大提升分类性能。此外,本文针对混合采样数据的样本数量不一致特点,设计了混合采样数据判别分析模型的分类方案。最后实验结果验证了本文方法的有效性。  相似文献   

8.
在构建舰船设备协同控制多智能体系统(MAS)过程中,各Agent之间存在某种内在的冲突、联系和规律,为了有效地发现和消解这些问题,引入智能控制解决方案和强化学习方法,能为MAS系统的构建提供有效的技术保障.本文提出了基于强化学习(RL)算法即改进的遗传算法并辅之以贝叶斯学习算法,来解决舰船MAS中各Agent中的任务分配问题、实现设备协同控制的优化和学习,并以舰船运动目标下的设备协同控制来具体验证上述算法,从而体现舰船运动控制MAS的可行性.  相似文献   

9.
抽油机示功图直观显示了抽油机工作情况,但实际工况情况呈现典型的长尾分布特性,类别严重不平衡。传统方法无法准确识别小类别工况,也无法获得井下工作状态准确识别。针对这一问题,提出一种基于分布驱动的多类别长尾数据代价敏感主动学习算法(Cost-sensitive active learning algorithm based on distribution -driven multi-class long-tailed data, CALA)。首先,考虑数据分布特性,以最小化代价为优化目标确定数据的最佳聚类簇数;其次,通过加入预分类误差代价来更新之前得到的最佳聚类簇数;然后,构建集成分类模型作为分类器;最后,通过迭代来平衡数据分布。采用某油田真实的示功图数据进行测试,显著性实验分析证明CALA在小类别工况诊断上具有更好的性能。  相似文献   

10.
为了研究重复使用运载器小升阻比无动力飞行时的制导技术,以投放着陆为背景,提出了一种基于轨迹在线生成的自适应制导技术.这种制导技术主要解决在线轨迹生成技术、自适应制导策略和制导规律问题.首先设计了自适应制导系统的体系结构,将在线轨迹生成技术、自适应制导策略和制导规律集成在一个框架中.在线轨迹生成技术充分考虑了重复使用运载器的飞行能力,根据当前的飞行状态和末端期望的飞行状态,在线规划轨迹剖面,产生一个物理上可飞的、稳定的轨迹剖面,并给出了设计方法.将轨迹生成与制导策略相结合,形成了具有一定自适应能力的制导回路.最后以某验证机为例,对在线轨迹生成、制导策略和制导规律进行了集成仿真.仿真结果表明,基于轨迹在线生成的自适应制导系统具有一定的自主性、鲁棒性和工程实用性.  相似文献   

11.
在分析高校《管理学原理》教学现状及存在问题的基础上,本研究借鉴挖掘性学习和探索性学习理论并结合长期教学实践,提出了基于挖掘性学习和探索性学习相结合的《管理学原理》教学方法及改革思路。  相似文献   

12.
内隐学习从提出至今已有三十多年的历史,由于其所具有的重要理论与实践价值,这一领域已吸引了众多学者的关注与探索.本文试对目前关于内隐学习的研究成果做一梳理,以期让人们较系统的了解这一领域并为今后的研究提供参考.  相似文献   

13.
多标记学习和选择性集成是机器学习中的两个热点研究问题。本文利用聚类思想探究多标记学习中的选择性集成, 提出了两种具体的多标记选择性集成算法:基于最小距离的簇中心选择算法(Minimum distance based cluster center selection,MDCCS)和基于K-means的簇中心选择算法(K-means based cluster center selection, KMCCS)。在所提出的算法中,如何度量学习器之间的距离是其能否成功的关键因素。本文首先基于学习器的分类结果对其进行重新表示,在此基础上给出了学习器之间距离的计算方式。此外, 对于算法中的空簇问题给出了两种解决方法。基于Mulan数据库中的多标记数据集和5种评价指标对所提算法进行了详细的分析,实验结果表明了所提算法的有效性。  相似文献   

14.
基于视频的行人再识别   总被引:1,自引:1,他引:0  
行人再识别是指在无交叉区域的多摄像机视频监控系统中,匹配不同摄像机中的相同行人目标。本文提出了一种基于视频的行人再识别方法,用HOG3D来描述一组视频的时空特征,在训练集上用预训练的DenseNet来微调模型参数,利用迁移学习得到的模型来提取视频中行人的表观特征,融合两种特征来描述视频序列中的行人。最后将融合的高维特征降维,并用度量学习方法计算行人对之间的距离。本文在PRID 2011和iLIDS-VID这两个视频数据集上进行了使用,实验结果表明本文的方法取得了较高的累积匹配得分。  相似文献   

15.
学生未来职业发展的知识面的拓宽和技能提升是职业技术学院开展实践教学的最终目标,而网络学习共同体则是实现该目标的一种全新的模式。这一模式作为一种为大学生提供丰富的实践学习资源和拓展了职业实践教学的方法,在国内外日益普及。本研究以高职学生在网络环境中所形成的学习共同体为研究对象,对其实践学习的效果进行了调研。研究结果发现:学生实践学习自我效能感显著提高;共同体成员间有交互,但交互强度不够;学生在职业角色扮演中实现了一定的转变。这些结论最终反映了网络学习共同体有助于提升学生的实践学习效果和工作经验,增强学生就业竞争力.为学生今后从事未来职业打下了基础。  相似文献   

16.
钢筋混凝土梁的配筋率是影响承载力的主要因素,配筋率的变化会使粱的承载力和受力性能都发生变化。本文通过对新旧混凝土结构设计规范中受弯构件最小配筋率的对比,对新旧规范的取值调整进行了理论分析,为广大工程设计人员加深对新规范的理解提供理论参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号