首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
非平衡学习吸引了许多研究者的关注。一般情况下,少数类是更值得关注的,并且其误分类代价要远高于多数类。由于非平衡数据分布的非均衡性,标准的分类算法将难以适用。为了解决非平衡数据分类问题,给出了基于欠采样的零阶优化算法。首先,为了降低数据非平衡分布的影响,针对不同非平衡比的数据集给出了不同的两种采样策略。然后,采用了一种引入间隔均值项的支持向量机(Support vector machine,SVM)优化模型进行分类,并使用带有方差减小的零阶随机梯度下降算法进行求解,提高了算法的精度。在非平衡数据上进行了对比实验,实验证明提出的方法有效提高了非平衡数据的分类效果。  相似文献   

2.
针对基于卷积神经网络的流量分类方法中流量数据范围选取会直接影响精度结果的问题,提出了基于一维卷积神经网络的加密单数据包分类算法.通过提取出五元组和应用层数据信息形成特定格式的样本数据,最大最小归一化处理后作为一维卷积神经网络的输入,实现对单个流量数据包分类;然后对经典一维卷积神经网络结构进行改进,设计自适应池化层,完成...  相似文献   

3.
异常航迹识别与交通流分类对复杂空域的安全与效率分析是重要的。一些研究人员使用基于密度的无监督聚类算法提取空域中这两种与管制行为相关的航迹数据。然而,数据质量问题和交通流之间的微小密度差异是这项工作的两个主要难点。为了解决这两个问题,本文提出一种结合稳健自编码器模型(Robust deep auto?en?coder,RDAE)和密度峰值(Density peak,DP)聚类算法的框架。具体地,通过不同的正则化优化方式使得RDAE模型分别用来重构去噪航迹与异常航迹检测。然后,RDAE模型的Encoder输出的非线性降维向量作为DP聚类算法的输入以分类空域中全局的交通流。在含有标签的广州白云机场数据集上的实验表明,所提算法能够自动地捕捉到空域内飞机运动的非常规时空交通模式。RDAE在异常航迹检测以及所提框架在交通流分类上的优越性均通过可视化与定量的结果评估分析。  相似文献   

4.
混合采样数据不仅仅具有不同采样频率数据之间特征集合不同,还有样本数量不一致等特点,传统的分类方法不能直接使用。因此,本文提出一种基于Fisher判别准则字典学习的混合采样数据分类方法以处理采样数据的分类任务。该模型巧妙借助处理多视图数据的分类思想,利用基于Fisher判别准则的字典学习方法,生成的结构化字典的每个原子与数据的类标签相关,同时采用Fisher判别准则使类内散度更小,类间散度更大来约束编码系数矩阵,从而大大提升分类性能。此外,本文针对混合采样数据的样本数量不一致特点,设计了混合采样数据判别分析模型的分类方案。最后实验结果验证了本文方法的有效性。  相似文献   

5.
航空修理企业物资编码的标准化对于航空修理系统信息化建设非常重要.本文阐述了物资分类与编码的原则、方法和结构,结合某航空修理企业物资管理、直升机维修过程管理的实际需要,对直升机件、发动机件、金属材料、非金属材料等物资的编码及基础数据管理办法进行研究,提出了与国家标准原则相一致、分类科学、结构简单、可操作性强的航空物资分类与编码的方法与结构.  相似文献   

6.
针对传统转子系统故障诊断方法在处理复杂故障数据时存在收敛速度慢和识别精度低问题,提出一种基于交叉熵代价函数的深度置信网络(DBN)故障识别方法。其采用无监督算法初始化限制性玻尔兹曼机(RBM)的参数空间,交叉熵代价函数反向传递误差,优化参数空间,逐层堆叠重置后RBM构建深层模型;利用已有数据建立转子系统智能识别库;在MNISIT手写数字集和转子系统故障数据集上验证,与传统DBN相比,利用交叉熵惩罚函数的深度置信网络可消除由于激活函数本身梯度对参数空间更新速度的影响,能有效地提高分类的精度。  相似文献   

7.
深度学习模型已经在文本和图像等分类任务上取得了不错的效果,然而深度学习模型很难为分类结果提供可解释性。本文提出一种非结构化数据的多粒度集成分类方法,与其他学习方法相比,多粒度集成分类方法能够保留数据的上下文信息。在多粒度集成分类方法中,数据被划分成不同的粒度,用于训练不同的基学习器,这些学习结果为集成模型最后的分类提供了可解释性。基学习器根据它们在验证集上的精度被赋予不同的权重,从而构造出一个较好的集成学习器。在实验中,本文验证了所提出模型在3种非结构化数据类型(文本、医学图像和时间序列)上的有效性。实验结果表明, 本文的模型比现有的基准方法简单,具有较好的分类精度,并且能够为数据的分类提供可解释性。  相似文献   

8.
大数据处理是近年来广受关注和研究的技术领域,数据挖掘作为从大量数据中挖掘隐藏价值信息的技术,是处理大数据的有效工具。本文主要从数据挖掘的角度对大数据处理算法的研究现状进行分类总结。首先介绍了大数据中针对流式数据分类的方法,包括单模型算法和集成分类算法;其次分别从单机算法和基于分布式并行平台的多机算法两个角度概括介绍了大数据聚类方法以及大数据关联规则挖掘方法;最后总结了现有面向大数据的数据挖掘算法的研究进展并展望未来的发展趋势。  相似文献   

9.
提出了一种基于模糊聚类算法的高维特征选取方法。首先,利用Bhattacharyya距离过滤样本类别无关的特征;然后,基于递归特征剔除过程,提出了基于模糊迭代自组织数据分析技术(Interactive self-organizing dataanalysis technique,ISODATA)聚类方法,以样本与聚类中心的加权距离作为可分性指标,产生候选特征子集;最后,以候选特征子集分类和聚类的接受者操作特征曲线下面积(Area under the receiver operating characteristiccurve,AUC)值和正确率作为目标函数,确定最佳特征子集。将该方法用于选取5个基因表达谱数据集的特征基因,结果显示该方法所选特征具有较好的分类和聚类能力,说明了提出的特征选取方法的有效性。  相似文献   

10.
在研究HHT(Hilbert-Huang Transform)理论中经验模态分解方法(EMD)和希尔伯特变换(Hilbert-Huang Transform)方法的基础上,根据IMF信号的时频序列特性,利用聚类算法得到每个时频序列的中心频率和干扰频率,并将与干扰频率对应时刻的IMF时域信号进行分类组合,从而消除IMF信号中的频率混叠问题,实现对信号的自适应滤波。利用所设计方法对实测信号进行自适应滤波分析并与传统数字滤波器滤波数据对比,结果表明提出的方法正确有效。  相似文献   

11.
提出一种新的方法,把分布式Kalman滤波(DKF)方法与后向传播神经网络(BPNN)技术相结合,用于静电陀螺漂移的模型辨识.首先,为了消除测量噪声影响,将同一个静电陀螺带有噪声的多次测量数据集映射到一个虚拟的传感器网络中,然后采用具有嵌入式紧致滤波功能的DKF对映射数据进行滤波预处理.在此基础上,将预处理结果转换为用于训练神经网络的输入数据和输出数据,然后采用BPNN辨识静电陀螺漂移.实验表明,该方法可有效用于陀螺漂移的模型辨识.  相似文献   

12.
为了进一步了解教师教育的研究热点和发展趋势,对近十年(2001-2010)核心期刊发表的关于教师教育的学术论文情况进行了统计和分类.通过分析,可以更好地认识教师教育研究的研究重点和发展方向,为教师教育研究人员提供一些参考和借鉴.  相似文献   

13.
把时序AR(n)预测模型和灰色GM(1,1) 预测模型两者有机结合起来,形成新的灰色时序模型的预测模型.以发动机光谱为例,经过实测数据检验,显示了其更好的预测效果.  相似文献   

14.
开发高性能的脑电解码方法一直是脑机接口系统研究的重点和难点。为了进一步提高运动想象脑电解码的性能,提出了基于特征融合和集成学习的脑电解码方法。首先,针对每个通道脑电信号提取方差、自回归(AR)系数和带通功率特征,接着进行特征融合。其次,提出两种新的集成学习方法,分别是基于K最近邻(KNN)的集成学习模型和基于最小绝对值收缩和选择算子(LASSO)的集成学习模型。其中,KNN集成模型针对KNN分类器的K值以及闵式距离的P值进行集成,LASSO集成模型针对LASSO分类器的正则化参数进行集成,这两种集成学习方法计算简单且不需要烦琐耗时的交叉验证过程进行模型选择。最后,在三个公开的运动想象脑电数据集上验证所提方法的有效性。实验结果表明,新提出的集成学习方法,其分类结果优于支持向量机、随机森林等现有的分类器。LASSO集成模型优于KNN集成模型,在三个数据集上取得了71.75%的最高平均分类准确率。  相似文献   

15.
少数类的集成学习   总被引:1,自引:0,他引:1  
传统机器学习中研究的分类问题通常假定各类别是平衡的,但在很多场合各类别的出现概率相差很大,而且很多应用中需要区分重要而稀少的少数类.本文比较了3种基于AdaBoost集成学习方法,并推导出他们的精度几何平均(GMA)的下界.分析表明:类别越不平衡,这3种方法越难以通过提高基分类器准确率来提高GMA.在此结论的基础上,以Bagging为基础提出了单边Bagging算法,该算法只对多数类抽样,而保留所有少数类,因而每轮的训练集是类别平衡的,并通过UCI数据集验证了其有效性.  相似文献   

16.
基于平方距离极小化方法(SDM),给出了用C-C细分曲面重构有特征的、任意拓扑三角网格模型的算法.首先识别特征并结合人工交互的方式在初始网格上进行四边域划分,然后直接在域面上对数据点进行近似参数化和分区,以域顶点为顶点构造初始控制网格.建立局部坐标系并优化每个数据点的参数值,基于SDM建立拟合方程.循环进行控制顶点的反求和待拟合数据点的参数校正,直至达到给定的误差要求.与传统的最小二乘法拟合(LSQ)相比,本文方法的逼近精度(二阶逼近)要高得多.  相似文献   

17.
由多个尽可能多样化的分类器(前馈神经网络)组成的多分类器系统(MCS)能够显著地提高单个分类器的分类或推广能力.受MCS基本思想的启发,将集成引入到双向联想记忆快速学习(QLBAM)中,构建出一个BAM集成,旨在提高存储容量和纠错性能的同时,不破坏每个成员BAM的简单结构.计算机仿真表明,选择合适的"过剩生产与挑选并存"策略,即"稀疏算法"后,所提出的BAM集成在存储容量和抗噪声性能两个方面都显著优于单个QLBAM.  相似文献   

18.
通过对卫星数据的分析所得到的矢量数据是没有位置信息等属性的,本技术主要是对这些矢量数据进行空间分析,赋予其位置信息等属性,从而对粮食作物(小麦、玉米)种植面积和设施面积进行监测。通过介绍空间分析中点与多边形拓扑关系的判断和多边形与多边形拓扑关系的判断,实现中心点法和面积占优法两种方法的属性挂接。研究表明:中心点法一般适用于具有连续分布且图斑较大的地理要素,如小麦和玉米等大面积种植的粮食作物;而面积占优法则适用于分类较小且图斑较小的设施等地理要素。  相似文献   

19.
空中交通的快速增长不断增加了管制员的工作负荷,这已成为制约部门运行的重要因素。如果能够识别出相似的交通场景,就可以利用历史决策经验帮助管制员快速决策控制策略。考虑到交通场景众多且难以标记所有样本,本文提出了一种主动支持向量机度量学习算法(Active SVM metric learning algorithm,ASVM2L)来度量和识别相似的交通场景。首先获得了一些由资深空中交通管制员标记的交通场景样本;接着设计了一种基于投票差异的主动查询策略来选择最有价值的未标记样本交予领域专家进行标记;然后,利用ASVM2L从所有标记样本中学习到一个度量矩阵,用于后续分类算法完成相似场景的分类。在标准数据集上验证了ASVM2L的有效性,然后在中国中南扇区的历史空中交通数据集上对交通场景进行了度量和分类。实验结果表明,与现有的其他方法相比,本文所提方法能够更彻底地利用样本的信息,在有限的标记样本下达到更高的分类精度。  相似文献   

20.
提出了一种结合图像中值滤波和试件参考点的风洞压敏涂料(PSP)试验图像数据处理方法.与通常用校准箱获取校准曲线进而得到PSP试验试件表面压力或压力系数(Cp)的方法不同,该方法通过空心中值滤波技术恢复PSP光强比图像中测压孔处的光强比数据,结合若干参考点处常规测压技术实测所得Cp值,获得Cp值和PSP图像光强比数据的关系曲线,进而得到整个试件表面的Cp值数据,该方法获得的数据结合了风洞试验诸多因素对试验结果的影响.利用MATLAB对PSP技术试验图像数据进行了处理,并将PSP方法获得的Cp值与常规测压方法获得的Cp值进行了比较,得到的结果显示,笔者采用的方法获得的Cp值与常规测压方法获得的Cp值吻合较好.该方法为PSP图像数据的处理提供了一种新的方法,具有较大的发展潜力和应用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号