首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
混合采样数据不仅仅具有不同采样频率数据之间特征集合不同,还有样本数量不一致等特点,传统的分类方法不能直接使用。因此,本文提出一种基于Fisher判别准则字典学习的混合采样数据分类方法以处理采样数据的分类任务。该模型巧妙借助处理多视图数据的分类思想,利用基于Fisher判别准则的字典学习方法,生成的结构化字典的每个原子与数据的类标签相关,同时采用Fisher判别准则使类内散度更小,类间散度更大来约束编码系数矩阵,从而大大提升分类性能。此外,本文针对混合采样数据的样本数量不一致特点,设计了混合采样数据判别分析模型的分类方案。最后实验结果验证了本文方法的有效性。  相似文献   

2.
少数类的集成学习   总被引:1,自引:0,他引:1  
传统机器学习中研究的分类问题通常假定各类别是平衡的,但在很多场合各类别的出现概率相差很大,而且很多应用中需要区分重要而稀少的少数类.本文比较了3种基于AdaBoost集成学习方法,并推导出他们的精度几何平均(GMA)的下界.分析表明:类别越不平衡,这3种方法越难以通过提高基分类器准确率来提高GMA.在此结论的基础上,以Bagging为基础提出了单边Bagging算法,该算法只对多数类抽样,而保留所有少数类,因而每轮的训练集是类别平衡的,并通过UCI数据集验证了其有效性.  相似文献   

3.
空中交通的快速增长不断增加了管制员的工作负荷,这已成为制约部门运行的重要因素。如果能够识别出相似的交通场景,就可以利用历史决策经验帮助管制员快速决策控制策略。考虑到交通场景众多且难以标记所有样本,本文提出了一种主动支持向量机度量学习算法(Active SVM metric learning algorithm,ASVM2L)来度量和识别相似的交通场景。首先获得了一些由资深空中交通管制员标记的交通场景样本;接着设计了一种基于投票差异的主动查询策略来选择最有价值的未标记样本交予领域专家进行标记;然后,利用ASVM2L从所有标记样本中学习到一个度量矩阵,用于后续分类算法完成相似场景的分类。在标准数据集上验证了ASVM2L的有效性,然后在中国中南扇区的历史空中交通数据集上对交通场景进行了度量和分类。实验结果表明,与现有的其他方法相比,本文所提方法能够更彻底地利用样本的信息,在有限的标记样本下达到更高的分类精度。  相似文献   

4.
视频行人重识别是一项应用非常广的计算机视觉任务。目前的视频行人重识别方法通常是基于监督学习的,该方法需要手工标记大量的数据,代价非常高且并不适用于现实场景。本文提出了一种从底向上的基于多样性约束和离散度分层聚类的无监督视频行人重识别方法。该方法首先将每个样本当作是一个不同的类,然后结合类内间离散度进行从底向上的分层聚类,类间和类内离散度都小的类别将被优先合并,同时在聚类准则中加入一项多样性约束来平衡每类中的样本数量,最后,利用线性变化的特征存储器动态更新模型。在Mars和DukeMTMC-VideoReID两个大型视频数据集上的实验结果表明,相比于目前先进的无监督视频行人重识别方法,本文方法在性能上有一定的提升。  相似文献   

5.
为了提高终端区相似气象场景(Similar weather scenarios,SWSs)的识别准确率,提出一种基于对比学习的SWS(SWS based on contrastive learning,SWS-CL)识别模型。首先,针对对流天气图像特点,设计了一种数据增强方法来增加天气图像样本的数量和质量。接着,设计了一种对比损失函数使向量表征空间中的正样本与锚点样本之间的距离更近,而负样本与锚点样本之间的距离更远,进而基于对比学习技术在无标记样本集上训练得到相似气象场景分类预训练模型。最后,利用少量标记样本对预训练SWS-CL模型进行监督微调,进一步提高SWS-CL模型的性能。在广州终端区气象图像集上的对比实验表明,所提出的数据增强方法能有效提高气象图像集的质量,所提出的SWS-CL模型能取得令人满意的识别精度,且在标签稀少的数据集上具有明显的优势。  相似文献   

6.
为了预测航空器滑行预计到达时间(Estimated time of arrival,ETA),减少场面冲突,提高机场运行效率,本文使用卡尔曼滤波算法对场面历史轨迹数据进行预处理。为了衡量轨迹样本间的距离,综合三类特征用于机场场面历史轨迹数据聚类。特征包含航空器滑行时段和场面航空器数量,以及参考动态时间规整(Dynamic time warping,DTW)算法提取的轨迹差异度特征。将两个样本特征的欧式距离作为样本间的相似度量;基于均差最大原则确定初始聚类中心,使用K-means算法对样本进行聚类,根据待规划航空器的所处时段和场面航空器数量选择匹配度最高的类簇,将其聚类中心样本的轨迹序列和塔台规划的静态路径相结合预测航空器滑行ETA。通过将实际轨迹数据与预测的滑行ETA进行对比分析,证明了本文预测航空器滑行ETA的准确性。  相似文献   

7.
传统的聚类算法一般只适用于静态数据的处理,而真实世界的数据往往数据量大且变化多,静态的聚类算法不能为动态数据提供其演化规律的分析学习。演化数据的聚类,一方面要正确反映每一时刻数据的合理簇划分,另一方面又要使动态的聚类结果在演化过程中尽可能平滑。本文提出了一种自适应时间平滑的演化聚类框架,该模型考虑到当前时刻数据与历史时刻数据的未知关联,通过限定时间回溯的范围,自适应地寻找与当前快照最相关的历史快照,并通过有机融合基于Itakura-Saito距离的静态相似度和基于时间序列的动态相似度,计算各个时间片快照上的相似度矩阵。本文进一步提出了两种自适应时间平滑的演化谱聚类算法,从不同的角度定义时间代价,得到不同的演化聚类结果。在真实数据集上的实验表明这两种算法能够有效地利用历史数据,在聚类结果上准确性更高,时间平滑性也更好。  相似文献   

8.
非平衡学习吸引了许多研究者的关注。一般情况下,少数类是更值得关注的,并且其误分类代价要远高于多数类。由于非平衡数据分布的非均衡性,标准的分类算法将难以适用。为了解决非平衡数据分类问题,给出了基于欠采样的零阶优化算法。首先,为了降低数据非平衡分布的影响,针对不同非平衡比的数据集给出了不同的两种采样策略。然后,采用了一种引入间隔均值项的支持向量机(Support vector machine,SVM)优化模型进行分类,并使用带有方差减小的零阶随机梯度下降算法进行求解,提高了算法的精度。在非平衡数据上进行了对比实验,实验证明提出的方法有效提高了非平衡数据的分类效果。  相似文献   

9.
空中交通的快速增长不断增加了管制员的工作负荷,这已成为制约部门运行的重要因素.如果能够识别出相似的交通场景,就可以利用历史决策经验帮助管制员快速决策控制策略.考虑到交通场景众多且难以标记所有样本,本文提出了一种主动支持向量机度量学习算法(Active SVM metric learning algorithm,ASVM...  相似文献   

10.
大数据处理是近年来广受关注和研究的技术领域,数据挖掘作为从大量数据中挖掘隐藏价值信息的技术,是处理大数据的有效工具。本文主要从数据挖掘的角度对大数据处理算法的研究现状进行分类总结。首先介绍了大数据中针对流式数据分类的方法,包括单模型算法和集成分类算法;其次分别从单机算法和基于分布式并行平台的多机算法两个角度概括介绍了大数据聚类方法以及大数据关联规则挖掘方法;最后总结了现有面向大数据的数据挖掘算法的研究进展并展望未来的发展趋势。  相似文献   

11.
深度学习模型已经在文本和图像等分类任务上取得了不错的效果,然而深度学习模型很难为分类结果提供可解释性。本文提出一种非结构化数据的多粒度集成分类方法,与其他学习方法相比,多粒度集成分类方法能够保留数据的上下文信息。在多粒度集成分类方法中,数据被划分成不同的粒度,用于训练不同的基学习器,这些学习结果为集成模型最后的分类提供了可解释性。基学习器根据它们在验证集上的精度被赋予不同的权重,从而构造出一个较好的集成学习器。在实验中,本文验证了所提出模型在3种非结构化数据类型(文本、医学图像和时间序列)上的有效性。实验结果表明, 本文的模型比现有的基准方法简单,具有较好的分类精度,并且能够为数据的分类提供可解释性。  相似文献   

12.
小样本图像分类任务要求模型仅从少量的图像样本中学到新类别的正确分类方法,是一种特殊的分类任务。然而,以往大多数小样本工作都单独处理来自不同类别的样本,而没有充分利用到不同类别间的信息。本文提出了一种新的类别融合网络(Category-fusion network, CFN),通过融合来自不同类别的样本信息,同时挖掘类别内和类别间的信息。CFN的重要部分是一个融合映射的学习,即如何融合样本中的特征,从而映射出网络参数。其中的一个重要问题是融合映射是否应该随不同的输入样本而改变。本文设计了3个不同的模块:具有固定映射的类无关模块、融合映射仅依赖于期望学习的目标类别的半相关模块和完全相关的模块,其中融合映射完全依赖于输入样本。本文的网络可以通过学习多个类别的样本之间的关系来进行类别概念的学习,并生成融合信息的分类器。实验结果表明,本文网络在广泛应用的MiniImageNet数据集上得到了60.03%的分类精度。  相似文献   

13.
捷联惯组中加速度计的标定通常采用转台来完成,而转台的不水平度会直接影响加速度计的标定精度。为量化不水平度误差带来的影响,本文从加速度计十二位置静态标定模型出发,理论推导出转台耦合不水平度与标定参数之间的关系;并通过仿真分析,发现不水平度对零偏、标度因素的影响较小,对安装误差系数的影响较大,为系数的超差现象分析提供参考依据。  相似文献   

14.
提出一种基于Spark计算框架的海量视频语义标注方法。将存储在Hadoop分布式文件系统(Hadoop distributed file system,HDFS)上的海量视频部署到若干计算节点上,依据分形特征实现镜头快速分割。提取样本关键帧的颜色、纹理和分形特征向量,进行元学习策略训练,进而形成视觉词典。根据视觉词典对检测视频内容进行分析,产生一系列能表征视频内容的视觉单词。根据重要程度,通过马尔科夫链按重要程度对视频的视觉单词进行排序,并将排列结果作为该视频的标注。最后,从检测正确率、平均运行时间和扩展效能方面与传统分布式计算模型进行了对比。  相似文献   

15.
研究非线性离散系统的迭代学习控制.利用并行分配补偿方法(PDC)确定非线性系统的T-S模型,把非线性模型特换为局部线性模型。假定数据丢失的概率已知,采用满足Bernoulli分布的序列来描述测量数据的丢失,研究具有测量数据部分丢失的线性离散系统的迭代学习控制器的设计。结合T-S模型设计了数据丢失的迭代学习控制器,所设计的迭代学习控制器具有期望收敛特性和二次型性能指标。仿真结果表明了该设计方法的有效性。  相似文献   

16.
为了进一步提升航空领域术语定义抽取的精度和效率,提出了一种不依赖已有特征选择方法的特征选择框架。该框架结合了分类特征的类间分布差异和类内分布差异,更好地表达了术语定义内部各子概念间特征分布的差异对划分类别的贡献。在分析该框架和传统过滤器特征选择方法对特征分布的影响的基础上,在航空领域术语定义语料库中对实验结果进行了对比。结果表明,本文提出的方法在使用平衡随机森林方法时,取得的最好成绩为F1-measure=0.652,F2-measure=0.761,所需特征比例从30%~40%降低到20%~30%;在使用直接分类方法时,F1-measure成绩提高了2.57倍,F2-measure成绩提高了3.11倍,均优于过滤器方法和Fisher Score方法。  相似文献   

17.
我国职业学校学生的学习动机显现出极不平衡的特点,其外部动机明显而内部动机缺乏。为此,我们应通过加强职业教育的教育功能,提高学生的学习兴趣和自信心,营造良好的外部环境等途径来激发学生学习的内部动机。  相似文献   

18.
深度强化学习在学习过程中需要与环境进行大量的交互,训练效率低下。模仿学习通过从专家示范中学习,可以有效地应对这一挑战,但是需要收集大量的专家示范轨迹,在复杂任务中往往导致高昂的示范代价。本文提出一种基于主动学习的行为克隆算法,通过主动挑选示范起始状态来减小示范代价。该方法基于不确定性采样和不相似性采样两种策略,从状态候选集中挑选最有价值的状态作为起始状态,然后向专家查询固定长度的示范轨迹,希望从尽可能少的示范中学习出有效策略。在多个不同任务上的实验表明,本文方法可以用更少的示范轨迹进行行为克隆,降低了强化学习中的专家示范代价。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号