首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
非负矩阵分解模型是一种常见的数据降维方法。在现有非负矩阵分解算法用于聚类的研究中,每个类别一般仅由一个或者指定多个中心点表示,然而这种表示方式往往无法准确描述其类别的特征和结构,从而影响聚类效果。为了解决这个问题,本文提出了峰值点非负矩阵分解算法。该算法首先为数据集找到多个密度峰值点,并构建密度峰值点和样本点的二部图,然后利用二部图完成聚类。此外该算法引入流形图正则化项来充分利用数据间的流形结构信息,并给出了算法的迭代更新规则。在大量真实数据集上的实验结果表明,该方法可以更加有效地利用数据本身的结构信息,从而提高聚类效果。  相似文献   

2.
基于L2范数度量的k平面聚类(k-Plane Clustering,k PC)设计思想,本文提出了一种采用L1范数度量的聚类算法。由于在平面更新步骤中,所导出的优化问题是非凸的,文中给出了一种求解方法,即将非凸问题转化为有限个子集上的凸问题,为避免求解多个优化问题导致训练时间过长问题,本文还设计了一种新的优选策略,有限个子集的搜索任务可在线性时间内完成。本文所提出的方法只需要求解k个线性规划,而不再是k PC的求解特征值问题。在人工和UCI数据集上的实验结果表明:基于L1范数平面聚类算法的训练和测试时间更短,且在大多数数据集上均表现出了更好的聚类性能。  相似文献   

3.
异常航迹识别与交通流分类对复杂空域的安全与效率分析是重要的。一些研究人员使用基于密度的无监督聚类算法提取空域中这两种与管制行为相关的航迹数据。然而,数据质量问题和交通流之间的微小密度差异是这项工作的两个主要难点。为了解决这两个问题,本文提出一种结合稳健自编码器模型(Robust deep auto?en?coder,RDAE)和密度峰值(Density peak,DP)聚类算法的框架。具体地,通过不同的正则化优化方式使得RDAE模型分别用来重构去噪航迹与异常航迹检测。然后,RDAE模型的Encoder输出的非线性降维向量作为DP聚类算法的输入以分类空域中全局的交通流。在含有标签的广州白云机场数据集上的实验表明,所提算法能够自动地捕捉到空域内飞机运动的非常规时空交通模式。RDAE在异常航迹检测以及所提框架在交通流分类上的优越性均通过可视化与定量的结果评估分析。  相似文献   

4.
传统的谱聚类算法通常利用高斯核函数作为相似度函数,由于算法对核参数非常敏感,且难于确定一个合适的尺度参数。为解决该问题,通过改进相似度函数,给出了谱聚类算法。在人工数据集和UCI数据集上的仿真实验表明,该算法提高了聚类的准确度,提升谱聚类算法的性能。  相似文献   

5.
在对模糊ISODATA算法分析的基础上,提出了一种适用于关联规则聚类ISODATA^*算法。本文首先分析了距离聚类的不足,然后结合关联规则的表示形式,提出了基于属性权重实现规则聚类的思想,并给出了相应的实现算法。最后采用国际上的UCI数据库进行了实验。实验表明该算法能有效地对关联规则进行聚类。  相似文献   

6.
传统的聚类算法一般只适用于静态数据的处理,而真实世界的数据往往数据量大且变化多,静态的聚类算法不能为动态数据提供其演化规律的分析学习。演化数据的聚类,一方面要正确反映每一时刻数据的合理簇划分,另一方面又要使动态的聚类结果在演化过程中尽可能平滑。本文提出了一种自适应时间平滑的演化聚类框架,该模型考虑到当前时刻数据与历史时刻数据的未知关联,通过限定时间回溯的范围,自适应地寻找与当前快照最相关的历史快照,并通过有机融合基于Itakura-Saito距离的静态相似度和基于时间序列的动态相似度,计算各个时间片快照上的相似度矩阵。本文进一步提出了两种自适应时间平滑的演化谱聚类算法,从不同的角度定义时间代价,得到不同的演化聚类结果。在真实数据集上的实验表明这两种算法能够有效地利用历史数据,在聚类结果上准确性更高,时间平滑性也更好。  相似文献   

7.
将特征加权的划分聚类方法应用在阴影集的框架中阴影聚类产生的核心区和边界区的样本对每一个类的质心有不同的影响。通过集成特征权重,加权计算的公式引入到聚类算法中。权重指数的选择对于好的聚类结果非常关键,而且权重随着每次迭代划分而更新。文中给出了算法的收敛性,并且使用了可行的聚类有效性指标。在合成数据集和真实数值数据集上的不同特征权重的实验结果表明,该加权算法优于其他不加权算法。  相似文献   

8.
聚类分析已成为对基因表达数据进行挖掘以提取生物医学信息的主要方法.本文提出了基于图论的最小支撑树(Minimum spanning tree,MST)聚类算法,用MST表示多维基因表达数据,可将数据的聚类转换为对最小支撑树的分割,相对于传统聚类方法,最小支撑树算法具有形象直观、对一些准则函数能产生全局最优解等优点;将MST算法分别与Memetic algorithm及人工免疫算法(Artificial immune network,aiNet)相结合,则产生更优化的聚类结果.对酵母基因表达数据的实验结果表明,最小支撑树聚类算法是一种有效的基因表达数据的聚类方法.  相似文献   

9.
为了降低数据稀疏性的影响,提高推荐系统的推荐生成质量,提出了一种基于多层相似性用户聚类的协同过滤推荐算法。该算法采用新的多层用户相似性度量,并将推荐过程分成了离线和在线两个部分。离线时,算法对基本用户数据进行预处理,并对基本用户聚类;在线时,算法利用已有的用户聚类寻找目标用户最近邻居,并产生推荐。实验表明,该算法不仅加快了推荐生成速度,而且提高了推荐质量,降低了约6%的平均绝对误差。  相似文献   

10.
基于相关性度量的伪主成分分析   总被引:2,自引:0,他引:2  
采用数据样本间的相关性作为相似性度量,并引入样本的类信息,提出一种新的降维方法,即伪主成分分析(Pseudo-PCA),该方法尽可能地保持原样本的变化信息,同时又使得降维后的同类数据样本尽可能保持相似。此外,将这种思想方法成功推广到近年来提出的2DPCA,MatPCA和(2D)2PCA。在ORL,Yale和AR等人脸数据集上的实验表明,该类方法的识别率高于相应的基于欧氏距离的PCA,2DPCA,M atPCA和(2D)2PCA等方法。  相似文献   

11.
应用聚类分析对关联规则进行分组   总被引:3,自引:0,他引:3  
关联规则是要从大量的数据中找到数据之间的规律,但有时所产生的规律十分繁多,从而形成新的知识管理问题。针对该问题本文提出了一个新的算法,该算法利用系统聚类分析方法对规则进行分组,从而可更好地帮助用户解所发现的规律,该方法的距离(RatioD)是基于关联规则本身,因此,可对规则进行高效地分组。实验结果表明,该算法是有效的。  相似文献   

12.
For the charging station construction of electric vehicle,location selecting is a key issue.There are two problems in location selection of the electric vehicle charging station.One is determining the location of charging station;the other is evaluating the location of charging station.To determine the charging station location,an spatial clustering algorithm is proposed and programmed.The example simulation shows the effectiveness of the spatial clustering algorithm.To evaluate the charging station location,a multi-hierarchical fuzzy method is proposed.Based on the location factors of electric vehicle charging station,the hierarchical evaluation structure of electric vehicle charging station location is constructed,including three levels,4first-class factors and 14second-class factors.The fuzzy multi-hierarchical evaluation model and algorithm are built.The analysis results show that the multi-hierarchical fuzzy method can reasonably complete the electric vehicle charging station location evaluation.  相似文献   

13.
Track association of multi-target has been recognized as one of the key technologies in distributed multiple-sensor data fusion system,and its accuracy directly impacts on the performance of the whole tracking system.A multi-sensor data association is proposed based on aftinity propagation(AP)algorithm.The proposed method needs an initial similarity,a distance between any two points,as a parameter,therefore,the similarity matrix is calculated by track position,velocity and azimuth of track data.The approach can automatically obtain the optimal classification of uncertain target based on clustering validity index.Furthermore,the same kind of data are fused based on the variance of measured data and the fusion result can be taken as a new measured data of the target.Finally,the measured data are classified to a certain target based on the nearest neighbor ideas and its characteristics,then filtering and target tracking are conducted.The experimental results show that the proposed method can effectively achieve multi-sensor and multi-target track association.  相似文献   

14.
改进型可能性C-均值聚类(Improved possib ilistic C-means,IPCM)是在综合了模糊C-均值聚类(Fuzzy C-means,FCM)和可能性C-均值聚类(Possib ilistic C-means,PCM)的基础上得到的。在IPCM的基础上,利用鲁棒统计观点和影响函数,引入一种新的距离度量以代替IPCM的目标函数中的欧式距离度量,提出了一种新的可能性C-均值聚类模型(A lternative improved possib ilistic C-means,A IPCM),并给出了该模型的具体实现算法。A IPCM具有良好的鲁棒性,更适合对含有噪声或野值的数据进行划分聚类。仿真实验表明,A IPCM能克服噪声敏感性问题,获得合适的聚类中心和高的聚类准确率。  相似文献   

15.
基于LOFC时间窗分割算法的航迹聚类研究   总被引:2,自引:2,他引:0  
针对传统聚类算法在聚类过程中缺乏时间信息而仅考虑三维坐标点的聚类,同时未考虑航空器运行速度和航向变化对聚类结果的影响,以及由于二次雷达机载设备、地面设备和信号遮挡等原因造成的实测数据源中存在离群点异常数据,离群点很难被有效识别出来从而使得非正常航迹点的影响放大,得不到理想的聚类效果等问题。本文提出LOFC算法,引入时间窗分割概念,将航空器进场平均速度值和航向变化值作为确定聚类簇大小的影响因子对进场航空器航迹点数量进行分割,引入离群点检测以及离群点剔除率等概念对离群点进行识别和剔除。对进场二次雷达数据仿真分析,从仿真结果中可以看出,新算法能有效地对离群点进行识别和剔除,当影响因子α取值为0.7时,航迹的曲率最小,得到的中心航迹的平滑程度最佳,验证了新算法对于聚类和离群点识别与剔除具有可行性和优越性。  相似文献   

16.
To learn from evolutionary experimental data points effectively,an evolutionary Gaussian mixture model based on constraint consistency(EGMM)is proposed and the corresponding method of parameter optimization is presented.Here,the Gaussian mixture model(GMM)is adopted to describe the data points,and the differences between the posterior probabilities of pairwise points under the current parameters are introduced to measure the temporal smoothness.Then,parameter optimization of EGMM can be realized by evolutionary clustering.Compared with most of the existing data analysis methods by evolutionary clustering,both the whole features and individual differences of data points are considered in the clustering framework of EGMM.It decreases the algorithm sensitivity to noises and increases the robustness of evaluated parameters.Experimental result shows that the clustering sequence really reflects the shift of data distribution,and the proposed algorithm can provide better clustering quality and temporal smoothness.  相似文献   

17.
研究了彩色图像的分割算法,提出了运用彩色图像的颜色特征相似性进行图像的分割;然后将分割的目标进行检测,运用无监督网络,即竞争网络学习训练聚类,将图像中不同的目标提取出来。在识别方面,研究了一种运用空间距离变换方法来识别的算法,计算出区域半径测试样本点在区域内还是区域外,以达到识别的目的。实验结果表明,本文提出的分割算法和识别算法可以很好地运用到实际中,识别率可达90%以上。  相似文献   

18.
基于分层分解的一种实时车辆路径规划算法   总被引:15,自引:0,他引:15  
道路网络通常是大规模和复杂的网络,而一般的最短路径算法需要大量的计算时间。为了减少计算负担,本文根据分层和空间分解的道路网络模型,提出了一种基于存储数据的车辆路径规划算法,路径通过查询表格获得。提出的算法尤其适用于集中式车辆路径规划。仿真结果表明,该算法在计算次最优路径时更快且要求更少的内存单元。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号