In [7]:
import pandas as pd
filname = 'ch02数据导入\student.xlsx'
data = pd.read_excel(filname)
data
Out[7]:
In [9]:
# 打印前3行数据
data.head(3)
Out[9]:
In [10]:
# 打印[1-3)行数据
data[1:3]
Out[10]:
In [11]:
# 根据列名,打印某一列数据
data['姓名']
Out[11]:
In [12]:
# 查看所有字段
field = data.columns.tolist()
field
Out[12]:
In [13]:
# 只显示第四行
data.loc[4]
Out[13]:
In [15]:
# 打印多个列数据,需要双层[[]]
data[["姓名", "年龄"]]
Out[15]:
In [16]:
# 查看基础数据
# mean = 均值
# std = 方差
data.describe() # 只针对数值型
Out[16]:
In [17]:
data2 = pd.read_excel(filname,header=None)
data2
Out[17]:
In [18]:
data2.values
Out[18]:
In [21]:
data.values
Out[21]:
In [22]:
data.index
Out[22]:
pandas参数说明
pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, usecols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)
1.io :excel 路径;
In [24]:
data3 = pd.read_excel(io=filname)
data3
Out[24]:
2.sheetname:默认是sheetname为0,返回多表使用sheetname=[0,1],若sheetname=None是返回全表 。注意:int/string返回的是dataframe,而none和list返回的是dict of dataframe。
In [32]:
data3 = pd.read_excel(filname,sheet_name=[0,1])
data3
Out[32]:
In [37]:
data3 = pd.read_excel(filname,sheet_name=0)
data3
Out[37]:
In [38]:
data3 = pd.read_excel(filname,sheet_name=1)
data3
Out[38]:
3.header :指定作为列名的行,默认0,即取第一行,数据为列名行以下的数据;若数据不含列名,则设定 header = None;
In [39]:
data3 = pd.read_excel(filname,sheet_name=0,header=None)
data3
Out[39]:
In [40]:
data3 = pd.read_excel(filname,sheet_name=0,header=2)
data3
Out[40]:
4.skiprows:省略指定行数的数据
In [42]:
data3 = pd.read_excel(filname, sheet_name=0, skiprows=1)
data3
Out[42]:
5.skipfooter:省略从尾部数的行数据
In [44]:
data3 = pd.read_excel(filname, sheet_name=0, skipfooter=1)
data3
Out[44]:
6.index_col :指定列为索引列,也可以使用 u’string’
In [46]:
data3 = pd.read_excel(filname, sheet_name=0, index_col=1)
data3
Out[46]:
7.names:指定列的名字,传入一个list数据
In [49]:
data3 = pd.read_excel(filname, sheet_name=0,
names=['a', 'b', 'c', 'd', 'e'])
data3
Out[49]: