一、DataFrame
DataFrame是一个表格型的数据结构,含有一组有序的列
DataFrame可以被看作是有Series组成的字典并且工用一个索引
1、创建方式
pd.DataFrame({'one':[1,2,3,4],'two':[4,3,2,1]})
pd.DataFrame({'one':pd.Series([1,2,3,],index=['a','b','c']),'two':pd.Series([1,2,3,4],index=['b','a','c','d'])})
2、csv文件读取与写入
pd.read_csv('601318.csv')
二、DataFrame读取与写入
1、写入到文件
In [5]: df.to_csv('601318.csv')
2、sep
df = pd.read_csv('601318.csv',sep=',') df
3、na_rep 指定缺失值转换的字符串,默认为空字符串
3、header=False 不输出列名一行
df = pd.read_csv('601318.csv',header=None) df = df.rename(columns={0:'a',1:'b'}) df
4、index=False 不输出行索引一列
5、cols 指定输出的列,传入列表
6、读取excel
7、其他文件类型
json,xml,HTML,数据库
pandas转换为二进制文件格式(pickle):
save load
三、DataFrame数据对齐与缺失数据
DataFrame对象在运算时,同样会进行数据对齐,