0%

Kmeans 聚类算法

kmeans 算法步骤

  • 第一步 - 随机选择 K 个点作为点的聚类中心,这表示我们要将数据分为 K 类。
  • 第二步 - 遍历所有的点 P, 算出 P 到每个聚类中心的距离,将 P 放到最近的聚类中心的点集中。遍历结束后我们将得到 K 个点集。
  • 第三步 - 遍历每一个点集,算出每一个点集的中心位置,将其作为新的聚类中心。
  • 第四步 - 重复步骤 2 和步骤 3,直到聚类中心位置不再移动。

ekGzVK.gif

如何确定 K 值

在确定 K 的时候,可以测试 10 个不同的聚类中心,然后绘制 K 与误差平方和的曲线图,找到曲线的拐点,即是合适的 K 值。

支持一根棒棒糖!