一、Series panda最基本的对象
# pandas的基础
s=pd.Series([1,3,6,np.nan,44,1])#建立个简单的基本对象 类似一个一位数组
print("建立个简单的基本对象 类似一个一位数组")
print(s)
s=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])
print("命名相关的索引")
print(s)
s.name="xuhan"#series的每个对象都有一个对应的索引和名称
s.index.name="行名"#对行索引进行命名
print("对行名和整个表的名称进行相关的命名:")
print(s)
# 切片操作
print("切片操作")#按行切片
print(s[1:3])
执行结果
建立个简单的基本对象 类似一个一位数组 0 1.0 1 3.0 2 6.0 3 NaN 4 44.0 5 1.0 dtype: float64 命名相关的索引 a 1 b 2 c 3 d 4 e 5 dtype: int64 对行名和列名进行相关的命名: 行名 a 1 b 2 c 3 d 4 e 5 Name: xuhan, dtype: int64 切片操作 行名 b 2 c 3 Name: xuhan, dtype: int64
二、Dataframe
2.1创建
# dataframe 的创建 dates=pd.date_range('20160101',periods=6,name="定义的日期表")#pd中的时间序列 从20160101开始 # # print(dates) # 第一个参数表示表内的矩阵 第二个参数是每一行的索引 第三个表示没一列的索引 df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=['a','b','c','d']) print(df) df2=pd.DataFrame(np.arange(1,13).reshape(3,4),index=list('123'),columns=list('abcd')) print(df2) df=pd.DataFrame(np.arange(12).reshape(3,4)) print(df)
结果:
a b c d 定义的日期表 2016-01-01 0.776594 -0.166321 0.156607 0.576739 2016-01-02 -1.649947 1.274599 0.571282 -0.605256 2016-01-03 -1.361043 0.013429 2.148883 -0.506440 2016-01-04 1.609952 0.498063 -0.763137 1.639300 2016-01-05 0.182889 0.630330 1.221402 -0.942096 2016-01-06 -0.348916 1.339488 1.477448 -1.320836 a b c d 1 1 2 3 4 2 5 6 7 8 3 9 10 11 12 0 1 2 3 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11
2.2对Frame中数据的排序
df=pd.DataFrame(np.arange(12).reshape(3,4)) print(df) print("输出表格内的数据") print(df.values)#values 表示输出表内的一系列数据 print("输出对列索引的倒叙排序") print(df.sort_index(axis=1,ascending=False))# 对列索引进行排序 就是对每一行的数据进行排序 print("输出对行索引的倒叙排序") print(df.sort_index(axis=0,ascending=False))#0是对行索引进行排序 print("对某一行的固定排序") print(df.sort_values(by=1,ascending=False))#按某一列进行固定的排序 print("输出表格的相关描述") print(df.describe())#count数量 mean平均值 std标准差 min最小值
结果:
0 1 2 3 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11 输出表格内的数据 [[ 0 1 2 3] [ 4 5 6 7] [ 8 9 10 11]] 输出对列索引的倒叙排序 3 2 1 0 0 3 2 1 0 1 7 6 5 4 2 11 10 9 8 输出对行索引的倒叙排序 0 1 2 3 2 8 9 10 11 1 4 5 6 7 0 0 1 2 3 对某一行的固定排序 0 1 2 3 2 8 9 10 11 1 4 5 6 7 0 0 1 2 3 输出表格的相关描述 0 1 2 3 count 3.0 3.0 3.0 3.0 mean 4.0 5.0 6.0 7.0 std 4.0 4.0 4.0 4.0 min 0.0 1.0 2.0 3.0 25% 2.0 3.0 4.0 5.0 50% 4.0 5.0 6.0 7.0 75% 6.0 7.0 8.0 9.0 max 8.0 9.0 10.0 11.0