[关闭]
@hainingwyx 2017-05-12T02:29:32.000000Z 字数 796 阅读 973

谱聚类新算法

聚类


LSC

2011年deng cai提出的基于标记点的大尺度谱聚类算法,2015年得到理论上的证明和误差证明,也说明了各个参数的选取影响以及未来的研究方向。标记点的选取可以选择KMeans或者随机选取。前者速度慢,准确性好,后者相反。两种方法的速度和准确率都是相对不错的。

算法原理

从二分图的矩阵出发,将特征值问题的求解经过转换和替代,发现是和特征值分解相关。

算法流程

具体步骤
1. 用kmeans或者随机选择的办法产生p个标记点U序列,kmeans计算复杂度是是KMeans的迭代次数
2. 根据公式(4)建立所有数据点和标记点之间的稀疏关联矩阵, 归一化每一数据点和r近邻标记点,计算复杂度为
3. 计算pxp的前k个特征向量,计算复杂度是
4. 根据公式7奇异值分解式子计算,B的列向量是(nxn)的特征向量,计算复杂度是,直接计算是(注意:)
5. 对的每一行数据做k-means获得聚类

程序下载地址:http://www.cad.zju.edu.cn/home/dengcai/Data/Clustering.html

影响因素

参考文献

  1. Chen X, Cai D. Large Scale Spectral Clustering with Landmark-Based Representation[C]//AAAI. 2011
  2. 2.
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注