数据建模（）-K-means聚类算法 - 走看看

zoukankan html css js c++ java

数据建模（）-K-means聚类算法

K-Means算法是典型基于距离的非层次聚类算法，在最小化误差函数的基础上将数据划分为预定的类数K，采用作为相似性的评价指标，即认为2个对象的距离越近，其相似度越大。

1.算法过程

1）从N个样本数据中随机选取K个对象作为初始的聚类中心

2）分别计算每个样本到各聚类中心的距离，将对象分配到距离最近的聚类中

3）所有对象分配完成后，重新计算K个聚类的中心

4）与前一次计算得到的K个聚类中心比较，如果聚类中心发生变化，转过程2），否则转过程5）当质心不发生变化时，停止并输出聚类结果

对于连续数据，聚类中心取该簇的均值

样本某些属性为分类变量时，均值可能无定义，可采用K-众数方法

对连续属性，要先对各属性值进行零-均值规范，再进行距离计算。K-Means聚类算法中，一般需要肚量样本间的距离、样本与簇间的距离、簇与簇间的距离

查看全文

相关阅读:
我与ARM的那些事儿1初识ARM
WP的万能小应用时钟表
 单片机的模拟智能灌溉系统
 android的计算器
 C语言经典面试题目（转的，不过写的的确好！）
数据库sqlite3在linux中的使用
 认识域模型
 认识JMS
认识JDOM
认识RMI

原文地址：https://www.cnblogs.com/Iceredtea/p/12230274.html

Copyright © 2011-2022 走看看