一、 DataFrame 相关
1 索引的使用(.loc[] .iloc[])
.loc用行列标签来选择数据。.iloc 根据行数与列数索引。
import pandas as pd data = pd.DataFrame({'A':[1,2,3],'B':[4,5,6],'C':[7,8,9]}) data A B C a 1 4 7 b 2 5 8 c 3 6 9 data.loc[1,'B'] 5 data.iloc[1,1] 5 data.iloc[1:2,1:2] 5 data.iloc[1:3,1:3] B C 1 5 8 2 6 9
2 数据整合(concat)
import pandas as pd import numpy as np df_obj1 = pd.DataFrame(np.random.randint(0, 10, (3, 2)), index=['a', 'b', 'c'],columns=['A', 'B']) df_obj2 = pd.DataFrame(np.random.randint(0, 10, (2, 2)), index=['a', 'b'], columns=['C', 'D']) df_obj3 = pd.DataFrame(np.random.randint(0, 10, (2, 2)), index=['a', 'b'],columns=['A', 'B']) pd.concat([df_obj1, df_obj2]) #列名相同时纵向堆砌 列名不同时横着排上 默认axis=0 A B C D a 1.0 0.0 NaN NaN b 9.0 9.0 NaN NaN c 6.0 1.0 NaN NaN a NaN NaN 1.0 6.0 b NaN NaN 1.0 8.0 pd.concat([df_obj1, df_obj2],axis=1) #横着排上 A B C D a 0 5 6.0 7.0 b 4 4 9.0 3.0 c 0 5 NaN NaN