zoukankan html css js c++ java

kmeans 对表达量进行聚类

代码如下

df = pd.read_csv("../kmeans/gene.fpkm.csv",header=None)
print df.head()
#去掉第一行
tdf = df.drop(index=[0])
#去掉第一列
mdf = tdf.drop([0],axis=1)
#获取第一列作为行的名称
rownames=tdf[0]
#获取第一行作为列的名称
gene=df.loc[0][1:]
#修改原始数据库的行列名
mdf.rename(index=rownames, columns=gene, inplace=True)
from sklearn.cluster import KMeans
seed = 9 # 设置随机数
clf = KMeans(n_clusters=3, random_state=seed) # 聚类
clf.fit(mdf)
mdf['label'] = clf.labels_ # 对原数据表进行类别标记
c = mdf['label'].value_counts()

查看全文

相关阅读:
du 命令
 iostat 命令
 sar 命令
 mkdir 命令
 time 命令
 date 命令
 history 命令
 vmstat 命令
 pmap 命令
 df 命令

原文地址：https://www.cnblogs.com/raisok/p/11458777.html

最新文章
WebGrid Helper with Check All Checkboxes
[webgrid] – header
[webgrid] – Ajax – (Reloading a Razor WebGrid after Ajax calls using a partial view)
jQuery 参考手册
 产品缺损分析系统
 电子毛笔
 Yemuzi Studio工作室
 也来说说验证码识别
 虚拟演播室
 机器视觉应用-文本倾斜校正

热门文章
物件识别与距离测量系统
 视频人流分析
 网络舆情监测系统
 信号实时频谱分析
 设计模式
 Java基础知识
 Java小知识
 多线程
 小服务程序（Java Servlet）
Spring