K-means算法
http://www.tuicool.com/articles/Vfy6zm
算法过程如下:
1)从N个文档随机选取K个文档作为质心
2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的类
3)重新计算已经得到的各个类的质心
4)迭代2~3步直至新的质心与原质心相等或小于指定阈值,算法结束
1、数据data[n], 分类组数k。
一堆样本数据1,4,5,3,8,10,22,56,65 假定K=2, 分组以后的类别数据可以定为 A组 {1}, B 组 {4}
2、计算样本数据data[n]各个数据到分类 K中的距离,并且进行分类。
计算各个样本数据到 A组以及B组的欧式距离,从而进行分类
3、对分类中求其平均聚类中心,再计算样本数据到各聚类中心的距离