首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 190 毫秒
1.
关联规则生成是数据挖掘技术中一个非常重要的研究领域,自1993年提出经典频集算法后,出现了很多以此为基础进行了改进的算法,但都存在着明显的缺陷.文章中根据遗传算法的基本思想以及关联规则挖掘的有关理论构造了一种生成多维多层关联规则的遗传算法,在一定程度上克服了经典频集算法的不足之处,提高了生成关联规则的有效性.  相似文献   

2.
在事务数据库中的周期性一般关联规则可以揭示类的不同层次之间的关系和呈现周期性变化。这些信息对于识别在关联中的趋势和预测非常有用。由于数据噪声对发现周期性一般关联规则的巨大影响 ,文中用噪声比来抑制数据噪声对发现周期性一般关联规则的影响。同时根据对周期性与一般高频集之间关系的分析 ,利用周期裁剪技术来节省挖掘时间 ,给出了 (Cyclic general-ized itemsets,CGI)算法。实验证明 ,该算法可高效地发现周期性一般关联规则。  相似文献   

3.
外关联规则挖掘   总被引:1,自引:0,他引:1  
根据项集内项的关联性,现有关联规则挖掘算法可分为正关联规则挖掘和负关联规则挖掘两大类,它们反映的是项集内频繁项之间的关联性。通过对实际数据集的分析发现,一个项集可以划分成若干子项集,子项集内的项有较高的相关性,而不同的子项集相关性则较低,这意味着每个子项集与其外部的一个潜在因子间存在着关联,由此本文提出了外关联规则的概念,并基于因子分析和主成分分析方法,提出了外关联规则挖掘算法(FAAR),从而将项集内的关联规则挖掘外推到子项集和潜在因子集之间的外关联规则挖掘,扩展和丰富了关联规则挖掘的应用,在此基础上还可进一步发现它所蕴涵的正、负关联规则。  相似文献   

4.
本文采用了一种快速算法Aprioti,将传统数据挖掘技术中的关联规则发现技术引入web数据挖掘,并针对在Web应用的特点进行了改进,有效地提高了求高频站点集的效率。  相似文献   

5.
传统的复杂系统故障诊断规则不易获取且方法单一,不能满足系统维护要求.文中全面考虑复杂系统诊断的数据来源,用灰色关联理论降低系统复杂性并通过粗糙集约简数据的思想实现灰色粗集推理.基于灰色粗集推理方法实现了故障诊断规则的获取,并通过实例验证方法的可行性,结果明显优于神经网络算法,可有效提高诊断效率.  相似文献   

6.
应用聚类分析对关联规则进行分组   总被引:3,自引:0,他引:3  
关联规则是要从大量的数据中找到数据之间的规律,但有时所产生的规律十分繁多,从而形成新的知识管理问题。针对该问题本文提出了一个新的算法,该算法利用系统聚类分析方法对规则进行分组,从而可更好地帮助用户解所发现的规律,该方法的距离(RatioD)是基于关联规则本身,因此,可对规则进行高效地分组。实验结果表明,该算法是有效的。  相似文献   

7.
在对模糊ISODATA算法分析的基础上,提出了一种适用于关联规则聚类ISODATA^*算法。本文首先分析了距离聚类的不足,然后结合关联规则的表示形式,提出了基于属性权重实现规则聚类的思想,并给出了相应的实现算法。最后采用国际上的UCI数据库进行了实验。实验表明该算法能有效地对关联规则进行聚类。  相似文献   

8.
为了预测论坛舆情及其动态演变趋势,基于多时间序列的关联分析,集中分析了论坛中3个量的时间序列之间的关联规则:活跃者之间的关系强度的时间序列、坚定支持者人数的时间序列以及坚定支持者成员的变化频度的时间序列。然后给出了一种新的基于多时间序列关联分析的论坛舆情预测算法(Forum sentiment trend prediction based on multi time series association rule analysis,TPMTSA),并在真实数据集和拟合数据集上进行了大量的实验。结果表明:TPMTSA算法具有有效性和较高的运行效率。研究结果可用于论坛舆情预警监控。  相似文献   

9.
针对传统的入侵检测方法在未知攻击上表现不佳、且没有考虑信息不足的情况对于决策的影响的问题,本文提出了一种基于三支决策和数据增广的入侵检测算法CGAN-3WD。算法利用条件生成对抗网络来满足三支决策理论对数据信息的需求。首先基于三支决策理论对网络行为做出决策,将网络行为划分至正域、负域以及边界域中;之后基于条件生成对抗神经网络来完成数据增广,生成新的样本数据,从而为分类器提供更多的信息以支撑分类器将边界域转化为正域或者负域。NSL-KDD数据集被用于本文的实验中,实验证明,本文提出的算法CGAN-3WD在对入侵行为的检测上要优于对比的方法,能够有效地检测出入侵行为。  相似文献   

10.
提出了一种基于多维空间超球体的快速聚类算法。这种算法结合密度聚类和层次聚类两种思想。首先利用密度聚类方法将小范围内的数据对象聚合成超球体,然后再按照层次聚类中的凝聚思想,根据超球体之间的位置关系产生最终聚类。实验表明,该算法对于数值型数据集不仅在效率、噪声敏感性等方面均有较好的表现,同时还可以通过诸如“双环测试”等带有刁难性的特殊测试集。以往,常常简单的以距离来刻画的数据间“相似性”,而所提出的快速聚类算法则改由超球体之间连接的紧密程度来描述这种性质。实验表明,这种修改使得算法的性能得到了很好的改善。  相似文献   

11.
一种基于DOM树的XML数据频繁模式挖掘算法   总被引:2,自引:0,他引:2  
由于XM L数据具有半结构化特性,使得面向XM L数据的数据挖掘不同于面向关系数据库的数据挖掘,它具有更复杂的层次结构。研究基于DOM树的XM L数据频繁模式挖掘算法,提出面向XM L数据的频繁模式增量式挖掘算法F reqtT ree。该算法首先将XM L数据转化成DOM树,然后从DOM树挖掘所有频繁模式。F reqtT ree算法采用最右扩展技术,只在树的最右分支上增加新结点生成新树。同时充分利用已生成的频繁模式信息,使得产生的候选模式数量较少。F reqtT ree算法利用频繁k-1模式的支持数计算候选k模式的支持数,该算法只对DOM树遍历一次,具有较高的效率。采用多组数据对此算法的性能进行检验,并与其他算法作对比实验,实验结果表明该算法高效可行。  相似文献   

12.
部分隐藏的随机化回答方法是基于关联规则数据挖掘的隐私保护算法,针对该算法在重构频繁项集支持度上的指数级时间复杂度导致算法执行效率下降的不足,采用分治策略和集合运算方法对该算法进行改进,消除重构数据的指数级运算。改进算法降低了算法的时间复杂度并有效提高了执行效率。仿真实验与分析表明了改进算法的有效性。  相似文献   

13.
针对现有空间索引不能满足多样化的检索需求,提出两种新型空间索引,能够同时面向空间属性、文本属性与划分属性进行空间对象检索。将分类技术应用于空间对象检索中,提出了基于划分索引与IR-Tree的混合索引以及先划分索引再IR-Tree的索引方法,不仅满足了多样化的空间检索需求,而且有效地解决了传统空间索引更新维护代价大的问题。基于真实的北京市POI数据集进行实验,结果表明本文提出两种索引是有效的且检索效率高。与传统空间索引相比,提出的空间索引很好地解决了具有划分属性的空间对象检索问题,并且具有较高的检索效率。  相似文献   

14.
粗集理论已成功应用于数据挖掘,如基于粗集方法的属性发现和决策规则的约简等。中介集合论是以中介逻辑为基础,也可以用于数据挖掘。文中将两者相结合,提出了中介粗集的概念。中介粗集是普通粗集的推广,为不完全信息系统的数据挖掘提供了新的工具,不仅可用于一般的信息系统,还适用于数据取空值的信息系统(允许结论取空值)。利用中介粗集进行数据挖掘不但可以得出粗集理论中的约简,还能得到更为简洁的中介约简。文中还给出了  相似文献   

15.
Realms是一种用于描述空间平面的数学模型。它提出了一种所有空间对象共享一个共同的空间元素集合的思想以及一种空间元素的排序规则。这些特点使得二维空间能够线性化为一维有序的元素集合,将二维空间问题转化为一维线性问题,从而使得基于Realms的空间数据组织能有效地支持平面扫描算法。通过对空间对象的简单扫描,能够实现多数空间分析算法。以Realms为基础实现空间数据管理系统能取得较高的效率,并且降低了  相似文献   

16.
Track association of multi-target has been recognized as one of the key technologies in distributed multiple-sensor data fusion system,and its accuracy directly impacts on the performance of the whole tracking system.A multi-sensor data association is proposed based on aftinity propagation(AP)algorithm.The proposed method needs an initial similarity,a distance between any two points,as a parameter,therefore,the similarity matrix is calculated by track position,velocity and azimuth of track data.The approach can automatically obtain the optimal classification of uncertain target based on clustering validity index.Furthermore,the same kind of data are fused based on the variance of measured data and the fusion result can be taken as a new measured data of the target.Finally,the measured data are classified to a certain target based on the nearest neighbor ideas and its characteristics,then filtering and target tracking are conducted.The experimental results show that the proposed method can effectively achieve multi-sensor and multi-target track association.  相似文献   

17.
聚类分析已成为对基因表达数据进行挖掘以提取生物医学信息的主要方法.本文提出了基于图论的最小支撑树(Minimum spanning tree,MST)聚类算法,用MST表示多维基因表达数据,可将数据的聚类转换为对最小支撑树的分割,相对于传统聚类方法,最小支撑树算法具有形象直观、对一些准则函数能产生全局最优解等优点;将MST算法分别与Memetic algorithm及人工免疫算法(Artificial immune network,aiNet)相结合,则产生更优化的聚类结果.对酵母基因表达数据的实验结果表明,最小支撑树聚类算法是一种有效的基因表达数据的聚类方法.  相似文献   

18.
从提高制造业信息化中数据质量的角度出发,分析了建立基于规则库和算法库的可扩展数据清理框架的必要性,设计了一种基于多种规则结合不同算法以流程方式完成清理任务的可重构的数据清理框架。在框架的设计中,以实例方式总结了数据质量问题的分类,详细阐述了该框架的结构、组成部分以及工作流程。最后,通过数据清理实例说明了该框架中流程的实现及其工作过程。本文提出的数据清理框架功能将随着不同领域清理任务的完成而不断完善。  相似文献   

19.
简化Q矩阵(Qr阵)是规则空间模型与属性层次方法的重要概念。基于属性层次结构,提出有效/无效项目的定义,研究属性层次结构的可达矩阵与有效项目之间的关系,给出有效/无效项目的判定定理。基于逐步向前回归的思想提出了求解Qr阵的渐增式扩张算法,给出相关理论依据。在考虑有效项目数的基础上,与Tatsuoka方法进行了实验比较,对属性个数为10的情况采用线性回归方法为两种方法建立了数学模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号