kmeans 算法步骤
- 第一步 - 随机选择 K 个点作为点的聚类中心,这表示我们要将数据分为 K 类。
- 第二步 - 遍历所有的点 P, 算出 P 到每个聚类中心的距离,将 P 放到最近的聚类中心的点集中。遍历结束后我们将得到 K 个点集。
- 第三步 - 遍历每一个点集,算出每一个点集的中心位置,将其作为新的聚类中心。
- 第四步 - 重复步骤 2 和步骤 3,直到聚类中心位置不再移动。
如何确定 K 值
在确定 K 的时候,可以测试 10 个不同的聚类中心,然后绘制 K 与误差平方和的曲线图,找到曲线的拐点,即是合适的 K 值。