首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于相似度的半监督学习工业数据分类算法
引用本文:孙栓柱,陈广,高阳,孙彬,李逗,杨晨琛.基于相似度的半监督学习工业数据分类算法[J].南京航空航天大学学报,2021,53(5):677-683.
作者姓名:孙栓柱  陈广  高阳  孙彬  李逗  杨晨琛
作者单位:1.南京大学计算机科学与技术,南京 210023;2.江苏方天电力技术有限公司,南京 211102
基金项目:江苏方天电力技术有限公司科技基金(KJ201919)资助项目。
摘    要:针对现实场景中大量无监督数据无法有效利用的特点,提出了一种基于数据相似度匹配的半监督学习算法。该方法结合一定的先验知识,通过无监督学习的方式,计算未标记数据与少量有标记数据之间相似度,从而对少数类样本进行扩充。利用构造后的数据集进行模型训练,从而提高模型对于少数类的识别效果。该方法能有效改进分类任务中数据分布不平衡及标记困难的问题,在一组基于真实场景下的电力传感器检测数据分类任务中取得了较好的少数类识别效果。通过对比传统以及半监督的多种分类算法,该方法虽然在准确率上低于传统方法,但是在召回率与F1值的表现上超越传统方法。

关 键 词:数据分类  半监督学习  相似度  不平衡学习  不平衡数据分类
收稿时间:2020/9/21 0:00:00
修稿时间:2021/1/5 0:00:00

Semi-supervised Learning Industrial Data Classification Algorithm Based on Similarity
SUN Shuanzhu,CHEN Guang,GAO Yang,SUN Bin,LI Dou,YANG Chenchen.Semi-supervised Learning Industrial Data Classification Algorithm Based on Similarity[J].Journal of Nanjing University of Aeronautics & Astronautics,2021,53(5):677-683.
Authors:SUN Shuanzhu  CHEN Guang  GAO Yang  SUN Bin  LI Dou  YANG Chenchen
Abstract:
Keywords:data classification  semi-supervised learning  similarity  unbalanced learning  unbalanced data classification
点击此处可从《南京航空航天大学学报》浏览原始摘要信息
点击此处可从《南京航空航天大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号