一、环境安装
1:pandas依赖处理Excel的xlrd模块,安装命令是:pip install xlrd 2:安装pandas模块还需要一定的编码环境,确保你的电脑有这些环境:Net.4 、VC-Compiler以及winsdk_web 3:步骤1和2 准备好了之后,可以开始安装pandas了,安装命令是:pip install pandas
二、基本用法
DataFrame 按照列和按照行进行索引数据
按照列索引 df[’column_name’].values
按照行索引 df.loc[’row_key’].values 或 df.iloc[index].values
df.iloc[行标签,列标签] 是基于索引位来选取数据集,需要注意的是行、列为区间时,前闭后开集合。
import pandas as pd # 默认读取第一个表单,前5行数据(不包含标题行,行号从0开始) df = pd.read_excel("test_case.xlsx") data = df.head() print("获取到的测试数据: {0}".format(data)) # 指定表单名:表单名或索引,0表示第一个表单,返回嵌套列表 df_01 = pd.read_excel("test_case_futureloan.xlsx",sheet_name = "login_case") 或者使用index指定表单,从0开始 df_01 = pd.read_excel("test_case.xlsx",sheet_name = 1) data_01 = df_01.values #获取数据,返回嵌套列表
print("获取到的测试数据: {0}".format(data_01))
# 读取指定行,0表示第一行,不包含表头 df = pd.read_excel("test_case_futureloan.xlsx") !!! pandas1.0.0.0版本后以iloc代替ix!!!! data = df_01["case_id"].values #读取某一列的值 或者 data = df.iloc[:, [9]].values # 读取指定列 data = df_01.iloc[1].values # 读取指定行 data = df_01.iloc[[0,1]].values # 读取多行,就要在iloc[]里面嵌套列表指定行数 data = df.iloc[:2].values # 读取前2行,index=0、1 data = df.iloc[[0,1],[1,2]] #[0,1]读取第1、2行 [1,2]分别读取第2、3列数据 data =df_01.iloc[:,[1,2,4]] #读取所有行指定列[1,2,4]数据 print("标题", df.columns[9]) # 指定列的标题 print("标题",df.columns.values) # 所有标题 print("获取到的测试数据: {0}".format(data))
因为data = df.iloc[i,:].values #获取数据,返回嵌套列表,不便于我们读取测试数据,所以需要将数据转换为字典格式:
data = df.iloc[i,:].to_dict()
获取表单所有测试数据:
test_data = [] #存放每行测试数据,列表嵌套字典格式 for i in fd_01.index.values: #获取表单行号,遍历 row_data = fd_01.iloc[i,:].to_dict() #转换为字典格式 test_data.append(row_data) print("获取到的测试数据: {0}".format(test_data))