首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
深度学习模型已经在文本和图像等分类任务上取得了不错的效果,然而深度学习模型很难为分类结果提供可解释性。本文提出一种非结构化数据的多粒度集成分类方法,与其他学习方法相比,多粒度集成分类方法能够保留数据的上下文信息。在多粒度集成分类方法中,数据被划分成不同的粒度,用于训练不同的基学习器,这些学习结果为集成模型最后的分类提供了可解释性。基学习器根据它们在验证集上的精度被赋予不同的权重,从而构造出一个较好的集成学习器。在实验中,本文验证了所提出模型在3种非结构化数据类型(文本、医学图像和时间序列)上的有效性。实验结果表明, 本文的模型比现有的基准方法简单,具有较好的分类精度,并且能够为数据的分类提供可解释性。  相似文献   

2.
提出了一种电能质量动态扰动特征向量的提取方法,分析比较了多种分类器对电能质量动态扰动的分类能力。首先采用小波包分解算法对电能质量信号某一频段内的信息进行精细分解从而提取出特征向量,然后针对该特征向量构造了相应的BP神经网络、学习向量量化(Learning vector quantization,LVQ)神经网络、自组织特征映射(Self-organizing map,SOM)神经网络及支持向量机(Support vector machine,SVM)分类器,并模拟实际电网中的复杂扰动信号提取其特征向量集,对多种分类器的分类能力进行对比。仿真结果表明,在较复杂的电能质量扰动情况中,支持向量机分类器仍能实现对信号的精确分类,对电能质量监测具有很好的应用价值。  相似文献   

3.
基于案例学习的决策方法具有易于理解、贴近 实际决策过程的优点,成为当前决策领域的一个研究热点。文中针对如何有效地集成不同决 策专家提供的案例信息,提出了一种基于协调权的案例学习群决策模型用以解决多属性分类 决策问题。该方法首先针对各决策者给出不同案例数据,通过构建混合整数规划模型,识别 出具有一致案例信息重要度最大化的典型案例集。然后设计了分类阈值远离程度最大化模型 ,以此确定兼容各个决策者案例信息的指标权重(协调权)和最优分类阈值,由此构建一致 性的效用函数并应用获得的阈值进行分类决策。最后通过案例研究以及与其他模型的比较分 析,验证了方法的可行性。  相似文献   

4.
提出一个新的基于集成学习的预测器(TargetPCM),对蛋白质接触图(特别是中长程)进行高精度的预测。首先,TargetPCM使用加权朴素贝叶斯分类器(Weighted Nave Bayes classifier,WNBC)融合3个接触图预测器的输出,其中WNBC中的权重参数通过粒子群算法优化得到;其次,将WNBC融合后的输出和基于序列的特征进行组合,得到更具鉴别能力的特征;在此基础上,应用极端随机树训练得到最终的蛋白质接触图预测模型。为了验证TargetPCM的有效性,在包含98个非冗余蛋白质的数据集上进行了测试。结果表明:对于短程、中程和长程接触,TargetPCM的Top L/5精度比现有最好的集成预测器(NeBcon)分别提高了8.2%,16.1%和5.3%。在CASP11上进一步的验证表明,对于短程、中程和长程接触,TargetPCM的Top L/5精度比现有最好的基于协同进化的集成预测器(MetaPSICOV)分别提高了7.4%,9.1%和7.5%。实验结果验证了本文所提蛋白质接触图预测方法的有效性。  相似文献   

5.
针对传统P300字符输入系统信号通道多、计算量大等问题,提出一种利用贝叶斯框架下组稀疏约束的P300信号识别算法来提高脑控机械手效率的方法。首先利用能使字符按行列方式闪烁的计算机界面对受试者的视觉系统产生刺激,同时使用自采集设备记录脑电信号。之后在贝叶斯框架下建立基于P300的BCI解码模型,同时完成P300特征检测和脑电通道选择,避免了大量的交叉验证,提高了字符输入效率。然后根据P300字符识别结果,将其转化为对应的机械手命令,通过以太网通讯方式传输给机械手,最终完成对机械手的控制。实验结果表明,文章提出的方法能有利于提高P300信号特征检测的准确率和处理效率。  相似文献   

6.
基于个人信用评估数据的不平衡、高维、非线性等特性,数据集的选取和优化显得尤为重要,文章设计了基于特征工程和树增强贝叶斯网络的个人信用评估模型。首先在数据平衡、特征编码和特征选择的基础上,实现数据集的优化,降低特征维度,简化模型的输入;然后,在树增强贝叶斯分类器上建立信用评估模型;最后以德国信用数据进行实证研究。结果表明,基于特征工程和树增强贝叶斯网络模型降低了复杂度,并有效提升了分类精度,模型稳健性较好。  相似文献   

7.
针对信用评估数据的高维、非线性和冗余特点,传统降维和评估方法分类错判率高的难题,提出一种基于主成分分析的贝叶斯分类器在个人信用评估中的方法。首先采用主成分分析方法提取信用评估特征,进行降维处理,消除不必要的冗余信息,简化贝叶斯网络的输入,然后分别在朴素贝叶斯和树增强朴素贝叶斯两种分类器上建立评估模型,最后对评估模型进行验证性实验,并与其他模型进行比较分析。结果表明,应用主成分分析的贝叶斯网络建立的个人信用评估模型简洁,易于推理,提高了个人信用评估的精度。  相似文献   

8.
鉴于单纯的基于支持向量机的检测方法存在分类器训练困难、计算量大和速度慢等问题,提出了一种在复杂背景中由粗到细的人脸检测定位方法。该方法针对非线性SVM分类器训练设计的不足改为训练线性SVM分类器以分类获取少量的候选区域,再在此基础上,利用人脸面部特征,对上述候选人脸做进一步的确认。实验结果表明该方法速度较快、误码率较低。  相似文献   

9.
少数类的集成学习   总被引:1,自引:0,他引:1  
传统机器学习中研究的分类问题通常假定各类别是平衡的,但在很多场合各类别的出现概率相差很大,而且很多应用中需要区分重要而稀少的少数类.本文比较了3种基于AdaBoost集成学习方法,并推导出他们的精度几何平均(GMA)的下界.分析表明:类别越不平衡,这3种方法越难以通过提高基分类器准确率来提高GMA.在此结论的基础上,以Bagging为基础提出了单边Bagging算法,该算法只对多数类抽样,而保留所有少数类,因而每轮的训练集是类别平衡的,并通过UCI数据集验证了其有效性.  相似文献   

10.
小样本图像分类任务要求模型仅从少量的图像样本中学到新类别的正确分类方法,是一种特殊的分类任务。然而,以往大多数小样本工作都单独处理来自不同类别的样本,而没有充分利用到不同类别间的信息。本文提出了一种新的类别融合网络(Category-fusion network, CFN),通过融合来自不同类别的样本信息,同时挖掘类别内和类别间的信息。CFN的重要部分是一个融合映射的学习,即如何融合样本中的特征,从而映射出网络参数。其中的一个重要问题是融合映射是否应该随不同的输入样本而改变。本文设计了3个不同的模块:具有固定映射的类无关模块、融合映射仅依赖于期望学习的目标类别的半相关模块和完全相关的模块,其中融合映射完全依赖于输入样本。本文的网络可以通过学习多个类别的样本之间的关系来进行类别概念的学习,并生成融合信息的分类器。实验结果表明,本文网络在广泛应用的MiniImageNet数据集上得到了60.03%的分类精度。  相似文献   

11.
单类支持向量机和支持向量数据描述是两种流行的基于支撑域的单分类器。为揭示采用高斯核后他们与密度估计之间的关系,首先将基于支撑域的单分类器统一到密度估计的框架下;其次证明了基于支撑域的单分类器诱导的密度估计和真实密度一致,同时也能减小积分平方误差。最后通过人工数据集实验验证了上述关系。  相似文献   

12.
由多个尽可能多样化的分类器(前馈神经网络)组成的多分类器系统(MCS)能够显著地提高单个分类器的分类或推广能力.受MCS基本思想的启发,将集成引入到双向联想记忆快速学习(QLBAM)中,构建出一个BAM集成,旨在提高存储容量和纠错性能的同时,不破坏每个成员BAM的简单结构.计算机仿真表明,选择合适的"过剩生产与挑选并存"策略,即"稀疏算法"后,所提出的BAM集成在存储容量和抗噪声性能两个方面都显著优于单个QLBAM.  相似文献   

13.
基于多分类器决策融合的印鉴真伪鉴别方法   总被引:4,自引:0,他引:4  
印鉴的自动识别对于实验银行印鉴数字化及计算机管理,实现银行对公业务的通存通兑有重大意义,符合票据法的要求,是银行业发展的需要,本文研究了模式识别领域中印鉴识别这一问题,提出了特征抽取和分类的新方法,基于差图像的成分统计特征抽取方法,发展了骨架图像的结构特征抽取方法,提出了特征点距离特征和笔划曲率特征内两种新的有效特征,本文提出了基于支持向量机(support vector machine,SVM)多分类器融合印鉴鉴别的方法,试验结果表明,本文的方法大大提高了印鉴的鉴别能力和可靠性,效果令人满意。  相似文献   

14.
为了解决发动机润滑油液磨粒图像监测只适用于微流且易受气泡干扰等问题,设计了一种可适用于相对大流量工作环境的油液磨粒光学图像在线监测系统,区分气泡和磨粒。通过该监测系统,批量采集了一系列磨损颗粒和气泡图片,用于后续图像分类算法的训练与测试。采用了一种基于背景差分和大津法的运动物体提取算法提取出大量磨粒及气泡图像样本,运用基于方向梯度直方图(Histogram of oriented gradients,HOG)进行特征提取和支持向量机(Support vector machine,SVM)分类算法对气泡和磨粒进行识别。实验结果表明,该监测系统能有效采集磨粒及气泡图像并进行自动识别。与基于形态学特征提取算法以及K最近邻(K-nearest neighbor,KNN)等传统分类算法相比,HOG-SVM算法分类精度更高,识别准确率可达83 8%。  相似文献   

15.
针对非平衡数据分类问题,提出了一种基于代价敏感的惩罚AdaBoost算法。在惩罚Adaboost算法中,引入一种新的自适应代价敏感函数,赋予少数类样本及分错的少数类样本更高的代价值,并通过引入惩罚机制增大了样本的平均间隔。选择加权支持向量机(Support vector machine,SVM)优化模型作为基分类器,采用带有方差减小的随机梯度下降方法(Stochastic variance reduced gradient,SVRG)对优化模型进行求解。对比实验表明,本文提出的算法不但在几何均值(G-mean)和ROC曲线下的面积(Area under ROC curve,AUC)上明显优于其他算法,而且获得了较大的平均间隔,显示了本文算法在处理非平衡数据分类问题上的有效性。  相似文献   

16.
行人再识别是指在无交叉区域的多摄像机视频监控系统中,匹配不同摄像机中的相同行人目标。本文提出了一种基于视频的行人再识别方法,用HOG3D来描述一组视频的时空特征,在训练集上用预训练的DenseNet来微调模型参数,利用迁移学习得到的模型来提取视频中行人的表观特征,融合两种特征来描述视频序列中的行人。最后将融合的高维特征降维,并用度量学习方法计算行人对之间的距离。本文在PRID 2011和iLIDS-VID这两个视频数据集上进行了使用,实验结果表明本文的方法取得了较高的累积匹配得分。  相似文献   

17.
因支持向量机算法对在线课程平台的学习行为分析有误差,提出了一种基于大数据的随机森林模型的特征加权支持向量机RFG-SVM算法,该算法是在传统支持向量机算法上做完善、修改。利用Gini指数对特征变量计算,再计算RF模型分类识别的准确度,获得特征设定权重值,完成权重值在支持向量机的核函数中的计算。实验结果表明,通过对不同学习行为的学生的学习效果的预测,发现该方法能有效帮助教育者通过在线平台分析学习者的学习行为,预测学习效果,具有更高的准确率和稳定性。  相似文献   

18.
混合采样数据不仅仅具有不同采样频率数据之间特征集合不同,还有样本数量不一致等特点,传统的分类方法不能直接使用。因此,本文提出一种基于Fisher判别准则字典学习的混合采样数据分类方法以处理采样数据的分类任务。该模型巧妙借助处理多视图数据的分类思想,利用基于Fisher判别准则的字典学习方法,生成的结构化字典的每个原子与数据的类标签相关,同时采用Fisher判别准则使类内散度更小,类间散度更大来约束编码系数矩阵,从而大大提升分类性能。此外,本文针对混合采样数据的样本数量不一致特点,设计了混合采样数据判别分析模型的分类方案。最后实验结果验证了本文方法的有效性。  相似文献   

19.
基于融合先验知识SVM的航班延误预警模型   总被引:1,自引:1,他引:1  
针对日益严重的航班延误问题,有必要通过预警机制减少其负面影响,对机场各时段延误程度的预警其实质是一个多类分类问题.利用先验知识确定了一种新的基于相对紧密度的方法来计算各样本的权值,并将其融合到支持向量机模型中,进而结合一对一法(OAO)形成一种一对一加权间隔支持向量机(OAO-WMSVM),用以实现一个多级航班延误预警模型.实验证明,用OAO-WMSVM建立的预警模型能有效判定机场各时段的延误等级;同时还证明,融合了先验知识的SVM比标准SVM具有更好的分类性能.  相似文献   

20.
提出了一种颜色直方图表示的彩色图像自动归于语义类别的策略。在这个分类策略中,主成分分析用于把高维颜色直方图映射至低维特征空间,低维的特征向量用于训练支持向量机分类器。实验结果表明,尽管现有的多种图像内容描述子对分类效果的影响不同,但它们都是高度冗余的,可以在不影响分类正确性的基础上被大幅度压缩。本文研究有助于实现基于内容图像检索相关反馈所要求的快速在线学习和重新归类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号