zoukankan      html  css  js  c++  java
  • 机器学习之KMeans聚类

    零、学习生成测试数据


    from sklearn.datasets import make_blobs
    from matplotlib import pyplot
    
    #  create test data sets
    datas, targets = make_blobs(
        n_samples=100, #样本数量
        n_features=2, #样本特征数
        centers=3, #中心数量
        cluster_std=[0.5, 1.0, 1.5], #方差
        center_box=(-20.0, 20.0),
        shuffle=True,
        random_state=None
    )
    
    pyplot.scatter(datas[:,0],datas[:,1],c=targets)
    pyplot.show()
    

    一、建立模型


    
    km = KMeans(n_clusters=3, random_state=10)#创建模型(几个群组,随机种子数)
    km.fit(datas, targets)#计算聚类
    y_hat = km.predict(datas)#给这个样本估计最接近的分组(簇)
    '''
    ret = km.fit_predict(datas) #返回一个给数据每一项分组的组号列表
    print km.get_params()#获取参数信息
    km.set_params(keyname=value)
    '''
    


    其他常用函数

    二、KMeans算法原理


  • 相关阅读:
    简单测试
    纸玫瑰
    Java 字符串编码 (保存成txt测试)
    创建 Filter
    jee中文名图片+tomcat ==> 中文乱码的另类处理(未成功)
    dom4j_01_02
    dom4j_01_01
    Java 字符串编码
    websocket

  • 原文地址:https://www.cnblogs.com/KevinGeorge/p/11450557.html
Copyright © 2011-2022 走看看