zoukankan html css js c++ java

python里面的xlrd模块详解以及样例

什么是xlrd模块？

　　♦python操作excel主要用到xlrd和xlwt这两个库，即xlrd是读excel，xlwt是写excel的库。

　　♦python读取excel中单元格的内容返回的有5种类型:

　　　　ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

相关方法介绍

Book(class) 由xlrd.open_work("example.xls")返回

nsheets:                      sheets数
sheet_names:                  sheet名称列表
sheets:                       sheet列表
sheet_by_index(sheetx):       按序号提取sheet
sheet_by_name(sheet_name):    按名称提取sheet



Sheet(class) 由Book object相关方法返回

name: 　　　　　　　　　　　　　　　　　　　　　　　　sheet名
nrows:                                          行数
ncols:                                          列数
cell(rowx,colx):                                第rows行colx列的单元格
cell_type(rowx,colx):                           数据类型
cell_value(rows,colx):                          数值
col(colx):                                      第colx列所有单元格组成的列表
col_slice(colx,start_rowx=0,end_rowx=None):     第colx列指定单元格组成的列表
col_types(colx,start_rowx=0,end_rowx=None):     第colx列指定单元格数值类型组成的列表
col_values(colx,start_rowx=0,end_rowx=None):    第colx列指定单元格数值组成的列表
row同样有col的各项操作，此处略去



Cell(class) 由Sheet object(s)相关方法返回

ctype:    一个int型变量，对应不同的数值类型
value:    单元格的值

方法以及返回值介绍

一、安装xlrd模块

　　♦ 到python官网下载http://pypi.python.org/pypi/xlrd模块安装，前提是已经安装了python 环境。

　　♦或者在cmd窗口 pip3 install xlrd

二、使用介绍

　　1、常用单元格中的数据类型

　　2、导入模块

 import xlrd

　　3、打开Excel文件读取数据

data = xlrd.open_workbook(filename)#文件名以及路径，如果路径或者文件名有中文给前面加一个r拜师原生字符。

　　4、常用的函数

♦ excel中最重要的方法就是book和sheet的操作

　　 1）获取book中一个工作表

table = data.sheets()[0]          #通过索引顺序获取

table = data.sheet_by_index(sheet_indx)) #通过索引顺序获取

table = data.sheet_by_name(sheet_name)#通过名称获取

以上三个函数都会返回一个xlrd.sheet.Sheet()对象

names = data.sheet_names()    #返回book中所有工作表的名字

data.sheet_loaded(sheet_name or indx)   # 检查某个sheet是否导入完毕

如：

2）行的操作

nrows = table.nrows  #获取该sheet中的有效行数

table.row(rowx)  #返回由该行中所有的单元格对象组成的列表

table.row_slice(rowx)  #返回由该列中所有的单元格对象组成的列表

table.row_types(rowx, start_colx=0, end_colx=None)    #返回由该行中所有单元格的数据类型组成的列表

table.row_values(rowx, start_colx=0, end_colx=None)   #返回由该行中所有单元格的数据组成的列表

table.row_len(rowx) #返回该列的有效单元格长度

3）列(colnum)的操作

ncols = table.ncols   #获取列表的有效列数

table.col(colx, start_rowx=0, end_rowx=None)  #返回由该列中所有的单元格对象组成的列表

table.col_slice(colx, start_rowx=0, end_rowx=None)  #返回由该列中所有的单元格对象组成的列表

table.col_types(colx, start_rowx=0, end_rowx=None)    #返回由该列中所有单元格的数据类型组成的列表

table.col_values(colx, start_rowx=0, end_rowx=None)   #返回由该列中所有单元格的数据组成的列表

如：

4）单元格的操作

table.cell(rowx,colx)   #返回单元格对象

table.cell_type(rowx,colx)    #返回单元格中的数据类型

table.cell_value(rowx,colx)   #返回单元格中的数据

table.cell_xf_index(rowx, colx)   # 暂时还没有搞懂

♦单元格：单元格是表格中行与列的交叉部分，它是组成表格的最小单位，可拆分或者合并。单个数据的输入和修改都是在单元格中进行的

如：

注意：注意作用域问题，之前获取的sheet之后，都在获取到这个sheet值后，在进行，行和列以及单元格的操作。

问题现象：

问题一：

　　♦1、使用open()函数、xlrd.open_workbook()函数打开文件，文件名若包含中文，会报错找不到这个文件或目录。

　　♦2、获取sheet时若包含中文，也会报错。

#打开文件
file = open(filename,'rb')

#打开excel文件
workbook = xlrd.open_workbook(filename)

#获取sheet
sheet = workbook.sheet_by_name(sheetname)

解决方案：

　　♦对参数进行转码即可。如：

filename = filename.decode('utf-8')

　　♦也试过unicode函数，不过，在ride中运行时出现了报错，所以不赞成使用。

filename = unicode(filename,'utf-8')

问题二;

　　问题描述： python读取excel中单元格内容为日期时，字段里明明是日期，可读取后显示的却是浮点数。

　　♦python读取excel中单元格的内容返回的有5种类型:

　　　　ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

1.判断类型演示：
>>> sheet2.cell(2,2).ctype  #1990/2/22
3
>>> sheet2.cell(2,1).ctype  #18
2
>>> sheet2.cell(2,0).ctype  #测试
1
>>> sheet2.cell(2,4).ctype  #空值（这里是合并单元格的原因）
0

2。解决浮点数问题，正确取值方式：
>>> sheet2.cell(2,2).value  #1990/2/22
33656.0
>>> xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode)
(1992, 2, 22, 0, 0, 0)
>>> date_value =xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode)
>>> date_value
(1992, 2, 22, 0, 0, 0)
>>> date(*date_value[:3])
datetime.date(1992, 2, 22)
>>> date(*date_value[:3]).strftime('%Y/%m/%d') 
'1992/02/22'

即可以做下简单处理，判断ctype是否等于3，如果等于3，则用时间格式处理：

if (sheet.cell(row,col).ctype == 3):
    date_value = xlrd.xldate_as_tuple(sheet.cell_value(rows,3),book.datemode)
    date_tmp = date(*date_value[:3]).strftime('%Y/%m/%d')

问题三：

　　问题描述：读取合并单元格内容中内容sheet2.cell(2,4).ctype返回的值是0，说明这个单元格的值是空值，这就是这个包不完善的地方，如果是合并单元格那么应该合并的单元格内容一样，但是它只是合并的第一个单元格有值，其它为空。

　　解决办法：通过获取merge_cells返回的row和col低位的索引来判断哪些是合并单元格，然后做后续取值操作。

　　　　读取文件的时候需要将formatting_info参数设置为True，默认是False，所以上面获取合并的单元格数组为空，

　　　　详细查看该链接：https://www.cnblogs.com/zhoujie/p/python18.html

2.为什么使用xlrd模块？

　　♦在UI自动化或者接口自动化中数据维护是一个核心，所以此模块非常实用。

3.怎样使用xlrd模块？

　　读取表格数据样例：https://www.cnblogs.com/iamjianghao/p/10764473.html

　　python selenium中Excel数据维护：https://www.cnblogs.com/insane-Mr-Li/p/9093212.html

查看全文

相关阅读:
OSI结构和TCP/IP模型
 将[4,3,2,5,4,3]分割成[4,3,2]、[5,4,3]两个List的算法
 Mybatis增加对象属性不增加mapper.xml的情况
 以脚本方式直接执行修改密码的passwd命令
 Raphael的鼠标over move out事件
 Raphael的Braille例子
 Raphael的set使用
 Raphael的transform用法
 Raphael的text及对齐方式
 Raphael初始化，path，circle，rect，ellipse，image

原文地址：https://www.cnblogs.com/iamjianghao/p/10764415.html