zoukankan      html  css  js  c++  java
  • kmeans 对表达量进行聚类

    代码如下

    df = pd.read_csv("../kmeans/gene.fpkm.csv",header=None)
    print df.head()
    #去掉第一行
    tdf = df.drop(index=[0])
    #去掉第一列
    mdf = tdf.drop([0],axis=1)
    #获取第一列作为行的名称
    rownames=tdf[0]
    #获取第一行作为列的名称
    gene=df.loc[0][1:]
    #修改原始数据库的行列名
    mdf.rename(index=rownames, columns=gene, inplace=True)
    from sklearn.cluster import KMeans
    seed = 9 # 设置随机数
    clf = KMeans(n_clusters=3, random_state=seed) # 聚类
    clf.fit(mdf)
    mdf['label'] = clf.labels_ # 对原数据表进行类别标记
    c = mdf['label'].value_counts()



  • 相关阅读:
    du 命令
    iostat 命令
    sar 命令
    mkdir 命令
    time 命令
    date 命令
    history 命令
    vmstat 命令
    pmap 命令
    df 命令
  • 原文地址:https://www.cnblogs.com/raisok/p/11458777.html
Copyright © 2011-2022 走看看