基于粗糙集特征选择的过拟合现象及应对策略 |
| |
引用本文: | 张文冬,亓慧,刘克宇,等. 基于粗糙集特征选择的过拟合现象及应对策略[J]. 南京航空航天大学学报,2019,51(5):687⁃692.DOI:10.16356/j.1005-2615.2019.05.015 |
| |
作者姓名: | 张文冬 亓慧 刘克宇 杨习贝 |
| |
作者单位: | 1.江苏科技大学计算机学院, 镇江, 212003;2.太原师范学院计算机系, 太原, 030619 |
| |
基金项目: | 国家自然科学基金 61572242 61502211;61503160)项目国家自然科学基金(61572242, 61502211, 61503160)项目资助。 |
| |
摘 要: | 在粗糙集方法中,利用向前启发式算法进行特征选择,是一个逐步加入重要度最高的特征的过程,直至满足所给定的约束条件。但使用这一策略选择出来的特征子集有可能产生过拟合现象。鉴于此,设计了一种新的启发式算法,其主要思想是借助交叉验证的方法对特征的重要度进行计算,当过拟合出现时,则采用截断式机制终止算法。使用邻域粗糙集模型,在UCI数据集上将启发式算法与所提算法进行对比分析,实验结果表明:所提算法能够有效地降低过拟合的程度;利用所提算法得到的特征子集能够带来更好的分类性能。
|
关 键 词: | 特征选择 启发式算法 邻域粗糙集 过拟合 |
收稿时间: | 2018-05-10 |
修稿时间: | 2018-06-30 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《南京航空航天大学学报》浏览原始摘要信息 |
|
点击此处可从《南京航空航天大学学报》下载全文 |
|