@hainingwyx
2017-05-12T10:29:32.000000Z
字数 796
阅读 1588
聚类
2011年deng cai提出的基于标记点的大尺度谱聚类算法,2015年得到理论上的证明和误差证明,也说明了各个参数的选取影响以及未来的研究方向。标记点的选取可以选择KMeans或者随机选取。前者速度慢,准确性好,后者相反。两种方法的速度和准确率都是相对不错的。
从二分图的矩阵出发,将特征值问题的求解经过转换和替代,发现是和特征值分解相关。
具体步骤
1. 用kmeans或者随机选择的办法产生p个标记点U序列,kmeans计算复杂度是是KMeans的迭代次数
2. 根据公式(4)建立所有数据点和标记点之间的稀疏关联矩阵, 归一化每一数据点和r近邻标记点,计算复杂度为
3. 计算pxp的前k个特征向量,计算复杂度是
4. 根据公式7奇异值分解式子计算,B的列向量是(nxn)的特征向量,计算复杂度是,直接计算是(注意:)
5. 对的每一行数据做k-means获得聚类
程序下载地址:http://www.cad.zju.edu.cn/home/dengcai/Data/Clustering.html