排序方式: 共有40条查询结果,搜索用时 93 毫秒
11.
一种基于模糊聚类的组合BP神经网络数据挖掘方法 总被引:1,自引:0,他引:1
介绍了一种基于模糊聚类的组合BP神经网络的数据挖掘方法,并给出了该方法的模型和启发式BP改进算法Heuristicbp。且将其应用于数学函数值预测中,取得了学习时间短和预测精度高的效果,证明该方法是有效的,具有较高的实际应用性。 相似文献
12.
一种基于DOM树的XML数据频繁模式挖掘算法 总被引:2,自引:0,他引:2
由于XM L数据具有半结构化特性,使得面向XM L数据的数据挖掘不同于面向关系数据库的数据挖掘,它具有更复杂的层次结构。研究基于DOM树的XM L数据频繁模式挖掘算法,提出面向XM L数据的频繁模式增量式挖掘算法F reqtT ree。该算法首先将XM L数据转化成DOM树,然后从DOM树挖掘所有频繁模式。F reqtT ree算法采用最右扩展技术,只在树的最右分支上增加新结点生成新树。同时充分利用已生成的频繁模式信息,使得产生的候选模式数量较少。F reqtT ree算法利用频繁k-1模式的支持数计算候选k模式的支持数,该算法只对DOM树遍历一次,具有较高的效率。采用多组数据对此算法的性能进行检验,并与其他算法作对比实验,实验结果表明该算法高效可行。 相似文献
13.
为了满足波音787飞机的目标要求,通用电气公司深入挖掘其技术储备来生产GEnx发动机.虽然发动机的结构及其大尺寸复合材料结构的细节早在2004年就已披露,但只是到目前通用电气公司才开始公开其材料方面的创新. 相似文献
14.
15.
从Web双语资源中获取术语翻译具有很大应用价值。从实用化术语翻译角度出发,设计了一个基于Web的中英术语翻译系统。该系统使用Google搜索引擎,通过关键词扩展技术搜索词汇表类型网页,从其搜索结果摘要中抽取术语翻译。实验结果表明系统取得良好性能:TOP1的正确率达到90.9%,TOP3的正确率达到95.4%。 相似文献
16.
17.
针对民航机务维修领域安全风险研究过程中文本数据利用不充分造成风险要素遗漏的问题,提出了基于改进LDA的机务风险要素识别模型(TF-IDF and Gaussian function-LDA,TG-LDA)。通过构建机务维修领域词典,改善文本挖掘预处理中分词精度不高的问题;针对LDA主题模型输入样本量大、噪声多的问题采用TF-IDF算法与高斯函数结合的词条双重优化模型对其优化,最终识别出26类机务维修不安全事件风险要素,并通过可视化进行了风险要素分析。结果表明,与传统算法对比,困惑度由7.19×10-4降低至2.13×10-4,改善了文本挖掘中风险要素遗漏的问题,同时识别出机务维修领域主要的风险要素为人员认知存在偏差、维修过程违规作业、人员遗忘/疏漏、检查不全面及飞机部件出现故障。 相似文献
18.
大数据处理是近年来广受关注和研究的技术领域,数据挖掘作为从大量数据中挖掘隐藏价值信息的技术,是处理大数据的有效工具。本文主要从数据挖掘的角度对大数据处理算法的研究现状进行分类总结。首先介绍了大数据中针对流式数据分类的方法,包括单模型算法和集成分类算法;其次分别从单机算法和基于分布式并行平台的多机算法两个角度概括介绍了大数据聚类方法以及大数据关联规则挖掘方法;最后总结了现有面向大数据的数据挖掘算法的研究进展并展望未来的发展趋势。 相似文献
19.
模糊测试作为当前最有效的漏洞挖掘方法,不仅比其他漏洞挖掘技术更能应对复杂的程序,而且可扩展性很强。在数据量相对较大的测试中,模糊测试输入样本集存在质量低、冗余性高和可用性弱等问题。因此,对模糊测试输入样本集进行研究,提出了启发式遗传算法,借助0-1矩阵,通过启发式遗传算法对样本的执行路径进行选取和压缩,从而获得优化后兼顾样本质量的样本集最小样本集合,进而加快模糊测试的效率。实验结果表明:在没有损失的情况下,样本集精简后模糊测试的时间比精简前降低了22%,压缩率相比传统方案提升约40%。 相似文献
20.