什么是xlrd模块?
♦python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。
♦python读取excel中单元格的内容返回的有5种类型:
ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
相关方法介绍
Book(class) 由xlrd.open_work("example.xls")返回 nsheets: sheets数 sheet_names: sheet名称列表 sheets: sheet列表 sheet_by_index(sheetx): 按序号提取sheet sheet_by_name(sheet_name): 按名称提取sheet Sheet(class) 由Book object相关方法返回 name: sheet名 nrows: 行数 ncols: 列数 cell(rowx,colx): 第rows行colx列的单元格 cell_type(rowx,colx): 数据类型 cell_value(rows,colx): 数值 col(colx): 第colx列所有单元格组成的列表 col_slice(colx,start_rowx=0,end_rowx=None): 第colx列指定单元格组成的列表 col_types(colx,start_rowx=0,end_rowx=None): 第colx列指定单元格数值类型组成的列表 col_values(colx,start_rowx=0,end_rowx=None): 第colx列指定单元格数值组成的列表 row同样有col的各项操作,此处略去 Cell(class) 由Sheet object(s)相关方法返回 ctype: 一个int型变量,对应不同的数值类型 value: 单元格的值
一、安装xlrd模块
♦ 到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境。
♦或者在cmd窗口 pip3 install xlrd
二、使用介绍
1、常用单元格中的数据类型
2、导入模块
import xlrd
3、打开Excel文件读取数据
data = xlrd.open_workbook(filename)#文件名以及路径,如果路径或者文件名有中文给前面加一个r拜师原生字符。
4、常用的函数
♦ excel中最重要的方法就是book和sheet的操作
1)获取book中一个工作表
table = data.sheets()[0] #通过索引顺序获取 table = data.sheet_by_index(sheet_indx)) #通过索引顺序获取 table = data.sheet_by_name(sheet_name)#通过名称获取 以上三个函数都会返回一个xlrd.sheet.Sheet()对象 names = data.sheet_names() #返回book中所有工作表的名字 data.sheet_loaded(sheet_name or indx) # 检查某个sheet是否导入完毕
如:
2)行的操作
nrows = table.nrows #获取该sheet中的有效行数 table.row(rowx) #返回由该行中所有的单元格对象组成的列表 table.row_slice(rowx) #返回由该列中所有的单元格对象组成的列表 table.row_types(rowx, start_colx=0, end_colx=None) #返回由该行中所有单元格的数据类型组成的列表 table.row_values(rowx, start_colx=0, end_colx=None) #返回由该行中所有单元格的数据组成的列表 table.row_len(rowx) #返回该列的有效单元格长度
3)列(colnum)的操作
ncols = table.ncols #获取列表的有效列数 table.col(colx, start_rowx=0, end_rowx=None) #返回由该列中所有的单元格对象组成的列表 table.col_slice(colx, start_rowx=0, end_rowx=None) #返回由该列中所有的单元格对象组成的列表 table.col_types(colx, start_rowx=0, end_rowx=None) #返回由该列中所有单元格的数据类型组成的列表 table.col_values(colx, start_rowx=0, end_rowx=None) #返回由该列中所有单元格的数据组成的列表
如:
table.cell(rowx,colx) #返回单元格对象 table.cell_type(rowx,colx) #返回单元格中的数据类型 table.cell_value(rowx,colx) #返回单元格中的数据 table.cell_xf_index(rowx, colx) # 暂时还没有搞懂
♦单元格:单元格是表格中行与列的交叉部分,它是组成表格的最小单位,可拆分或者合并。单个数据的输入和修改都是在单元格中进行的
如:
注意:注意作用域问题,之前获取的sheet之后,都在获取到这个sheet值后,在进行,行和列以及单元格的操作。
问题现象:
问题一:
♦1、使用open()函数、xlrd.open_workbook()函数打开文件,文件名若包含中文,会报错找不到这个文件或目录。
♦2、获取sheet时若包含中文,也会报错。
#打开文件 file = open(filename,'rb') #打开excel文件 workbook = xlrd.open_workbook(filename) #获取sheet sheet = workbook.sheet_by_name(sheetname)
解决方案:
♦对参数进行转码即可。如:
filename = filename.decode('utf-8')
♦也试过unicode函数,不过,在ride中运行时出现了报错,所以不赞成使用。
filename = unicode(filename,'utf-8')
问题二;
问题描述: python读取excel中单元格内容为日期时,字段里明明是日期,可读取后显示的却是浮点数。
♦python读取excel中单元格的内容返回的有5种类型:
ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
1.判断类型演示:
>>> sheet2.cell(2,2).ctype #1990/2/22 3 >>> sheet2.cell(2,1).ctype #18 2 >>> sheet2.cell(2,0).ctype #测试 1 >>> sheet2.cell(2,4).ctype #空值(这里是合并单元格的原因) 0
2。解决浮点数问题,正确取值方式: >>> sheet2.cell(2,2).value #1990/2/22 33656.0 >>> xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode) (1992, 2, 22, 0, 0, 0) >>> date_value =xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode) >>> date_value (1992, 2, 22, 0, 0, 0) >>> date(*date_value[:3]) datetime.date(1992, 2, 22) >>> date(*date_value[:3]).strftime('%Y/%m/%d') '1992/02/22'
即可以做下简单处理,判断ctype是否等于3,如果等于3,则用时间格式处理:
if (sheet.cell(row,col).ctype == 3): date_value = xlrd.xldate_as_tuple(sheet.cell_value(rows,3),book.datemode) date_tmp = date(*date_value[:3]).strftime('%Y/%m/%d')
问题三:
问题描述:读取合并单元格内容中内容sheet2.cell(2,4).ctype返回的值是0,说明这个单元格的值是空值,这就是这个包不完善的地方,如果是合并单元格那么应该合并的单元格内容一样,但是它只是合并的第一个单元格有值,其它为空。
解决办法:通过获取merge_cells返回的row和col低位的索引来判断哪些是合并单元格,然后做后续取值操作。
读取文件的时候需要将formatting_info参数设置为True,默认是False,所以上面获取合并的单元格数组为空,
详细查看该链接:https://www.cnblogs.com/zhoujie/p/python18.html
2.为什么使用xlrd模块?
♦在UI自动化或者接口自动化中数据维护是一个核心,所以此模块非常实用。
3.怎样使用xlrd模块?
读取表格数据样例:https://www.cnblogs.com/iamjianghao/p/10764473.html
python selenium中Excel数据维护:https://www.cnblogs.com/insane-Mr-Li/p/9093212.html