pandas（二） - 走看看

zoukankan html css js c++ java

pandas（二）

层级索引：

　　index=[('a',2010),('b',2011),('c',2010'),('a',2012),('e',2010),('f',2011)]

　　age=[18,17,18,16,18,17]

常规创建

　　pop =pd.Series(age,index=index)

MultiIndex创建

　　index= pd.MultiIndex.from_tuples(index)

　　pop = pop.reindex(index) 最原先的索引重置为multiindex

　　pop[:,2010] 取出2010的所有数据

　　

高维数据的多级索引：

　　pop_df = pop.unstack()

　　本质是生成一个a-f为行索引，年份为列索引的矩阵，缺失值用nan

　　pop = pop_df.stack() 和unstack相反

多级索引创建：

　　直接将index参数设为二维

　　df = pd.DataFrame(np.random.rand(4,2),

　　　　　　　　　　　　　　index=[['a','a','c','d'],[1,2,1,1]],

　　　　　　　　　　　　　　columns=['data1','data2'])

　　将元祖作为键的字典传入

　　data = {('a',1):18,('a',2):19,('b',1):20}

　　pd.Series(data)　　

　　

　　显式创建多级索引

　　pd.MultiIndex.from_arrays([['a','a','b','b'],[1,2,1,2]])

　　pd.MultiIndex.from_tuples([('a',1),('a',2),('b',1),('b',2)])　　

多级索引等级名称

　　pop.index.names=['name','year'] 以前面例子来说给name是a一列的名称，year是2010一列的形成

Series多级索引

获取单个元素：

　　pop['a',2010]

　　也可以支持局部取值

　　pop['a']

　　局部切片

　　pop['a':'c'] 但要求muliIndex按顺序排列

　　pop[:,2012]

　　pop[pop>18]

　　pop[['a','b']]

　　　　

　　

　　

　　

查看全文

相关阅读:
初涉数组
 声明
 简述java程序中的main方法
 概述java语言
 1.3 linux基础(三)
linux基础之-screen命令
 1.2 linux基础（二）
1.1 Linux基础（一）
实验7-1-13 装箱问题
 实验7-1-12 组个最小数

原文地址：https://www.cnblogs.com/saber-xi/p/10642917.html