1). 扑克牌手动演练k均值聚类过程:>30张牌,3类
第一轮:
第二轮:
第三轮:
2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题)
3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.
4). 鸢尾花完整数据做聚类并用散点图显示.
5).想想k均值算法中以用来做什么?
答:K-means算法是典型的基于距离的聚类算法,即对各个样本集采用距离作为相似性的评价指标,若两个样本集的距离越近,其相似度就越大。所以我觉得可以使用K-means算法处理图像的像素,图像常用的编码方式为RGB编码,即用三基色(RED,GREEN,BLUE)表示图像颜色。每个像素由三个8位无符号二进制数(范围从0到255)表示其像素颜色,例如,一个像素的颜色可以用(220,101,25)
表示。给定的图像包含这数千种颜色,通过K均值算法,将相似的颜色作为一种,就可以将其颜色的数量降至16种,从而实现图像压缩。