首页 | 本学科首页   官方微博 | 高级检索  
     检索      

结构与纯度结合的新型决策树分裂准则
引用本文:杜斐,陈松灿.结构与纯度结合的新型决策树分裂准则[J].南京航空航天大学学报,2023,55(3):534-543.
作者姓名:杜斐  陈松灿
作者单位:1.南京航空航天大学计算机科学与技术学院,南京 211106;2.工信部模式分析和机器智能重点实验室,南京 211106
基金项目:国家自然科学基金(62076124)。
摘    要:决策树(Desision tree, DT)生长关键步骤的分裂或分叉准则通常根据纯度和误分类误差等实现,分裂生长分为轴平行和非轴平行方式。这些分裂准则一般与数据内在结构(如类别是否是多簇或单簇组成)无关。为了弥补这一缺失,本文提出了两种混合分裂准则,分别用加权和两步法将同类内的节点间距(Between-node margin within the same class,BNM)和同一节点内的类紧性(Within-class compactness and between-class separation in the same inner node,CSN)与纯度度量相结合。由于传统决策树以贪婪方式生长,仅能确定出当前的一个局部最优分裂点,为改善这个缺点,本文首先根据纯度确定出前k个候选分裂点,然后通过最大化BNM和最小化CSN确定最终的分裂点,不仅缓和了纯度上的局部最优性,而且引入了数据结构的全局性,因此能较大程度地改进后代节点的分裂,增强树的泛化性和可解释性。将上述两种分裂准则组合还可以进一步提升性能。在21个标准验证数据集上的比较结果表明:新准则下的决策树不仅提高了预测性能、降低了复杂性,而且相比于其他采用混合分裂准则的DTs更具竞争力。

关 键 词:决策树  分裂准则  全局结构  纯度  数据结构
收稿时间:2022/6/7 0:00:00
修稿时间:2022/10/10 0:00:00

Novel Splitting Criteria for Decision Trees with Combination of Structure and Purity
Du Fei,Chen Songcan.Novel Splitting Criteria for Decision Trees with Combination of Structure and Purity[J].Journal of Nanjing University of Aeronautics & Astronautics,2023,55(3):534-543.
Authors:Du Fei  Chen Songcan
Abstract:
Keywords:decision tree  split criterion  global structure  purity  data structure
点击此处可从《南京航空航天大学学报》浏览原始摘要信息
点击此处可从《南京航空航天大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号