聚类是对点集按照某种距离测度将它们聚成多个簇的过程。聚类目标是使得同一簇内的点之间距离较短,而不同的簇中的点之间距离较大。
一般把数据聚类归纳为一种非监督式学习。
*距离测量
*K-均值聚类方法
*基于密度的聚类方法(DBSCAN)
*均值漂移聚类(MeanShift)
*用高斯混合模型(GMM)的最大期望(EM)聚类
*凝聚式层次聚类(HAC, Hierarchical Agglomerative Clustering)
*图团体检测(Graph Community Detection)
==相关性挖掘==