1). 扑克牌手动演练k均值聚类过程:>30张牌,3类
(1-10)*4=40张
中心1 |
10 |
5 |
6 |
样本数量 |
7 |
19 |
11 |
样本均值 |
8.14 |
2.89 |
1.36 |
中心2 |
8 |
3 |
1 |
样本数量 |
19 |
11 |
7 |
样本均值 |
8 |
4.09 |
1.57 |
中心3 |
8 |
4 |
2 |
样本数量 |
19 |
7 |
11 |
样本均值 |
8 |
4.57 |
2 |
①
②
③
2). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.
3). 鸢尾花完整数据做聚类并用散点图显示.
4).想想k均值算法中以用来做什么?
通过聚类来描述物体本身最微小的差别,来进行归类,像极了我们阅人无数,通过大量的人的数据来进行学习,来分辨各类各样的人,可以用来比如分类有某个特征的事情或者物品....