排序方式: 共有158条查询结果,搜索用时 15 毫秒
141.
142.
基于用户查询日志提出了新的查询聚类算法.用户查询日志数据量大,比通常用于查询聚类的查询展现日志和查询点击日志更加稠密,不易产生聚类小的问题,但噪声多,不容易处理.为发现相似查询并减少噪声影响,同一用户同一时段的多次查询(共现查询)之间认为具有较高相似概率.在这一假设基础上,利用查询共现关系建立查询的邻居查询向量空间.将查询用邻居查询向量表示,邻居查询向量的相似度作为聚类中的查询相似度.应用改进的基于密度聚类算法完成聚类.实验证明,95 262个查询组成数据集上,聚类算法实现查准率79.77%、查全率48.21%,平均聚类大小达到51. 相似文献
143.
智慧城市多模式数据融合模型 总被引:1,自引:0,他引:1
随着云计算和大数据等技术的发展及城市发展的迫切需求,智慧城市已成为近年来国内外研究的热点之一。随着城市中摄像头、监测传感器等采集设备数量的增加,城市数据种类也越来越多。所获取的城市数据具有多源、异构、时变、高维等多模式特性。如何让这些多模式的城市数据关联起来,实现它们的互通互联,挖掘出更丰富多样的信息,从而能更好地指导智慧城市的构建,是本领域的难点。本文提出了一个城市多模式数据融合模型,即多模式互联生长(MICROS)模型,并从3个层面对该模型进行了描述。首先,针对多模式数据的特点,重点描述了多模式数据多源、异构、时变、高维等特点。其次,针对多模式数据的特点,自底向上构建实现针对多模式数据的融合过程的3层基础模型,分别是服务信息描述模型、元数据模型和数据互联模型。最后,在这3层模型的基础上,本文提出了一个适用于智慧城市建设的多模式数据融合模型。 相似文献
144.
145.
针对经验的空间大气模型会在轨道预报中造成较大的误差,以某型号卫星作为基准航天器,提出2种不同精度的轨道预报模型作为仿真基础,以产生训练数据和测试数据。利用3种数据挖掘中的分类方法,如支持向量机(SVM)、神经网络(NN)、随机森林(RF)等方法,对空间大气模型在轨道预报时造成的误差进行监督学习,借此反演误差简化模型中大气模型的偏差并进行修正。分类器的训练结果表明,随机森林方法由于随机选择决策树、随机选择分类项目,按照最大概率反演的大气模型误差准确率高达99.99%,支持向量机次之,最大准确率仅为50.7%,前馈负向传播神经网络容易出现不学习的情况,应用效果最差。相比传统数理统计方法,本文方法具有快速处理大数据集、能够挖掘隐藏在轨道预报微小误差中的潜在信息等优势。 相似文献
146.
147.
研究了采用碰撞的方式进行小行星防御的动力学问题。采用多面体模型来建立小行星的外形模型,以碎石堆模型来建立小行星的结构模型,计算了小行星受到与其密度和材质相同的球体高速碰撞过程和碰撞后的碎石分布。计算过程在考虑了小行星与碰撞球体的接触形变以及小行星内部组成碎石堆的接触形变条件下,计算了碎石堆内部的相互引力、法向接触力、切向静摩擦力、切向动摩擦力和滚动摩擦力矩。以小行星101955 Bennu(中文名贝努)为对象计算了潜在威胁小行星的碰撞防御过程的动力学行为。结果显示:采用高速碰撞的方法进行小行星防御可以有效地将小行星撞成大量碎小的石块,且该方法具有核爆的方法不可比拟的优势,即对空间环境无污染。 相似文献
148.
149.
数据仓库技术在决策支持系统的应用 总被引:2,自引:0,他引:2
简述了数据仓库,联机分析处理,数据挖掘的概念和技术,提出和实现了一种利用数据仓库技术及其工具,结合传统DSS 的四库结构,设计和实现决策支持系统的新方法 相似文献
150.
一种基于有效修剪的最大频繁项集挖掘算法 总被引:2,自引:0,他引:2
对关联挖掘中的最大频繁项集挖掘问题进行了研究,提出了一种基于项集格修剪机制的最大频繁项集挖掘算法.采用项集格生成树的数据结构,将最大频繁项集挖掘过程转化为对项集格生成树进行深度优先搜索获取所有最大频繁节点的过程. 其中提高算法效率的一个重要措施是在遍历项集格生成树的过程中对生成树进行修剪.给出了项集格生成树的三个性质,并在此基础上提出了直接超集修剪、间接超集修剪与事务集等价修剪三种修剪机制,尽可能忽略非频繁节点及其所生成的扩展节点以减少遍历的节点数目.试验结果表明,三种修剪机制都能够有效地减少搜索空间,其中事务集等价修剪机制的效果最好,算法的性能与输入数据集的稠密程度相关. 相似文献