常见的聚类算法包括:
1. K均值聚类(K-means Clustering):将数据集划分为K个簇,每个簇的中心点是该簇内所有样本的平均值。
2. 层次聚类(Hierarchical Clustering):通过逐步合并或分割样本来构建聚类层次结构,可以是凝聚型(自底向上)或分裂型(自顶向下)。
3. DBSCAN(Density-Based Spatial Clustering of Applications with Noise):基于样本之间的密度连接来进行聚类,能够发现任意形状的簇,并且能够处理噪声和离群值。