k-means是一种无监督学习算法,用于聚类。
下图(来自http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html)展示了k-means算法k=2时的聚类过程。
第一步:给定k个中心点,然后依次遍历所有数据点,计算每个数据点到k个中心点的距离,距离最短的就归为该中心点
第二步:利用在第一步的结果重新计算中心点
第三步:循环第一第二步直到k个中心点不再变化。