首页 | 本学科首页   官方微博 | 高级检索  
     

一种开放式数据清理框架
引用本文:陆凤霞,王静秋,王宁生. 一种开放式数据清理框架[J]. 南京航空航天大学学报, 2006, 38(4): 459-463
作者姓名:陆凤霞  王静秋  王宁生
作者单位:南京航空航天大学机电学院,南京,210016;南京航空航天大学机电学院,南京,210016;南京航空航天大学机电学院,南京,210016
摘    要:从提高制造业信息化中数据质量的角度出发,分析了建立基于规则库和算法库的可扩展数据清理框架的必要性,设计了一种基于多种规则结合不同算法以流程方式完成清理任务的可重构的数据清理框架。在框架的设计中,以实例方式总结了数据质量问题的分类,详细阐述了该框架的结构、组成部分以及工作流程。最后,通过数据清理实例说明了该框架中流程的实现及其工作过程。本文提出的数据清理框架功能将随着不同领域清理任务的完成而不断完善。

关 键 词:数据清理  规则库  算法库  框架  数据质量
文章编号:1005-2615(2006)04-0459-05
收稿时间:2005-10-19
修稿时间:2006-06-20

Open Data Cleaning Frame
Lu Fengxia,Wang Jingqiu,Wang Ningsheng. Open Data Cleaning Frame[J]. Journal of Nanjing University of Aeronautics & Astronautics, 2006, 38(4): 459-463
Authors:Lu Fengxia  Wang Jingqiu  Wang Ningsheng
Abstract:To improve the data quality in manufacturing information,the necessity of the data cleaning frame(DCF) is analyzed and an extensible DCF is proposed based on the rule warehouse and the arithmetic algorithm warehouse.And an extensible DCF implemented by the flow mode based on multi-rule combining the variable algorithm is designed.In the frame design,the problem of the data quality is summarized using examples,then the structure,components and the workflow of the frame are expatiated.Finally,an example for data cleaning shows the realization process of the workflow in the frame.The function of the proposed DCF becomes more and more perfect and powerful with the success of data cleaning practice in different fields.
Keywords:data cleaning  rule warehouse  arithmetic algorithm warehouse  frame  data quality
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号