首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于信息熵的连续属性自动聚类算法
引用本文:许志兴,丁运亮,伍华林.基于信息熵的连续属性自动聚类算法[J].南京航空航天大学学报,2001,33(3):233-236.
作者姓名:许志兴  丁运亮  伍华林
作者单位:1. 南京航空航天大学航空宇航学院
2. 华东电子集团公司
摘    要:基于信息熵的有关理论,提出了一种新的连续属性的自动聚类算法。首先介绍了Shannon熵的概念及其两个重要的定理,基于信息的不确定测度,提出了一种Shannon熵的准则函数φ,并且指出了该准则函数必须满足的6条原则。其次,基于该准则函数,引出了一种针对单个连续属性自动聚类的FUSINTER算法。由于实际信息系统中有多个连续属性,这主需要对多个连续属性分别使用FUSINTER算法进行离散,并且要求最终保证整个信息系统离散是相容的和一致的,而且各个属性拥有较少的分割区间。最后,本文以干线飞机外形参数的变化趋势与其更新换代的关系来说明文中提出的属性离散化过程,并展示了该聚类算法的有效性。本文提出的方法可以用于机器学习或数据挖掘的数据前处理。

关 键 词:连续属性  FUSINTER算法  自动聚类算法  信息熵  数据挖掘  数据库
文章编号:1005-2615(2001)03-0233-04
修稿时间:2000年6月20日

Automatic Clustering Algorithm for Continuous Attributes Based on Entropy of Information
Xu Zhixing Wu Hualin Ding Yunliang College of Aerospace Engineering,Nanjing University of Aeronautics & Astronautics Nanjing ,P.R.China Huadong Electronics Group Co. Nanjing ,P.R.China.Automatic Clustering Algorithm for Continuous Attributes Based on Entropy of Information[J].Journal of Nanjing University of Aeronautics & Astronautics,2001,33(3):233-236.
Authors:Xu Zhixing Wu Hualin Ding Yunliang College of Aerospace Engineering  Nanjing University of Aeronautics & Astronautics Nanjing  PRChina Huadong Electronics Group Co Nanjing  PRChina
Institution:Xu Zhixing~1 Wu Hualin~ 2 Ding Yunliang~1 1 College of Aerospace Engineering,Nanjing University of Aeronautics & Astronautics Nanjing 210016,P.R.China 2 Huadong Electronics Group Co. Nanjing 210028,P.R.China)
Abstract:
Keywords:entropy  clustering  continuous attributes  categories attributes  discretization  FUSINTER algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号