zoukankan      html  css  js  c++  java
  • python里面的xlrd模块详解以及样例

    什么是xlrd模块?

      ♦python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。

      ♦python读取excel中单元格的内容返回的有5种类型:

        ctype :  0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

    相关方法介绍

    Book(class) 由xlrd.open_work("example.xls")返回
    
    nsheets:                      sheets数
    sheet_names:                  sheet名称列表
    sheets:                       sheet列表
    sheet_by_index(sheetx):       按序号提取sheet
    sheet_by_name(sheet_name):    按名称提取sheet
    
    
    
    Sheet(class) 由Book object相关方法返回
    
    name:                         sheet名
    nrows:                                          行数
    ncols:                                          列数
    cell(rowx,colx):                                第rows行colx列的单元格
    cell_type(rowx,colx):                           数据类型
    cell_value(rows,colx):                          数值
    col(colx):                                      第colx列所有单元格组成的列表
    col_slice(colx,start_rowx=0,end_rowx=None):     第colx列指定单元格组成的列表
    col_types(colx,start_rowx=0,end_rowx=None):     第colx列指定单元格数值类型组成的列表
    col_values(colx,start_rowx=0,end_rowx=None):    第colx列指定单元格数值组成的列表
    row同样有col的各项操作,此处略去
    
    
    
    Cell(class) 由Sheet object(s)相关方法返回
    
    ctype:    一个int型变量,对应不同的数值类型
    value:    单元格的值
    方法以及返回值介绍

    一、安装xlrd模块

      ♦ 到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境。

      ♦或者在cmd窗口  pip3 install  xlrd

    二、使用介绍

      1、常用单元格中的数据类型

      2、导入模块

     import xlrd

      3、打开Excel文件读取数据

    data = xlrd.open_workbook(filename)#文件名以及路径,如果路径或者文件名有中文给前面加一个r拜师原生字符。

      4、常用的函数

           ♦ excel中最重要的方法就是book和sheet的操作

          1)获取book中一个工作表

    复制代码
    table = data.sheets()[0]          #通过索引顺序获取
    
    table = data.sheet_by_index(sheet_indx)) #通过索引顺序获取
    
    table = data.sheet_by_name(sheet_name)#通过名称获取
    
    以上三个函数都会返回一个xlrd.sheet.Sheet()对象
    
    names = data.sheet_names()    #返回book中所有工作表的名字
    
    data.sheet_loaded(sheet_name or indx)   # 检查某个sheet是否导入完毕
    复制代码

    如:

       2)行的操作

    复制代码
    nrows = table.nrows  #获取该sheet中的有效行数
    
    table.row(rowx)  #返回由该行中所有的单元格对象组成的列表
    
    table.row_slice(rowx)  #返回由该列中所有的单元格对象组成的列表
    
    table.row_types(rowx, start_colx=0, end_colx=None)    #返回由该行中所有单元格的数据类型组成的列表
    
    table.row_values(rowx, start_colx=0, end_colx=None)   #返回由该行中所有单元格的数据组成的列表
    
    table.row_len(rowx) #返回该列的有效单元格长度
    复制代码

     3)列(colnum)的操作

    复制代码
    ncols = table.ncols   #获取列表的有效列数
    
    table.col(colx, start_rowx=0, end_rowx=None)  #返回由该列中所有的单元格对象组成的列表
    
    table.col_slice(colx, start_rowx=0, end_rowx=None)  #返回由该列中所有的单元格对象组成的列表
    
    table.col_types(colx, start_rowx=0, end_rowx=None)    #返回由该列中所有单元格的数据类型组成的列表
    
    table.col_values(colx, start_rowx=0, end_rowx=None)   #返回由该列中所有单元格的数据组成的列表
    复制代码

    如:

          4)单元格的操作  

    复制代码
    table.cell(rowx,colx)   #返回单元格对象
    
    table.cell_type(rowx,colx)    #返回单元格中的数据类型
    
    table.cell_value(rowx,colx)   #返回单元格中的数据
    
    table.cell_xf_index(rowx, colx)   # 暂时还没有搞懂
    复制代码

    ♦单元格:单元格是表格中行与列的交叉部分,它是组成表格的最小单位,可拆分或者合并。单个数据的输入和修改都是在单元格中进行的

    如:

    注意:注意作用域问题,之前获取的sheet之后,都在获取到这个sheet值后,在进行,行和列以及单元格的操作。

     

    问题现象: 

    问题一:

      ♦1、使用open()函数、xlrd.open_workbook()函数打开文件,文件名若包含中文,会报错找不到这个文件或目录。 

      ♦2、获取sheet时若包含中文,也会报错。

    复制代码
    #打开文件
    file = open(filename,'rb')
    
    #打开excel文件
    workbook = xlrd.open_workbook(filename)
    
    #获取sheet
    sheet = workbook.sheet_by_name(sheetname)
    复制代码

    解决方案:

      ♦对参数进行转码即可。如:

    filename = filename.decode('utf-8')

      ♦也试过unicode函数,不过,在ride中运行时出现了报错,所以不赞成使用。

    filename = unicode(filename,'utf-8')

     问题二;

      问题描述:  python读取excel中单元格内容为日期时,字段里明明是日期,可读取后显示的却是浮点数。

      ♦python读取excel中单元格的内容返回的有5种类型:

        ctype :  0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

    1.判断类型演示:
    >>> sheet2.cell(2,2).ctype #1990/2/22 3 >>> sheet2.cell(2,1).ctype #18 2 >>> sheet2.cell(2,0).ctype #测试 1 >>> sheet2.cell(2,4).ctype #空值(这里是合并单元格的原因) 0

    2。解决浮点数问题,正确取值方式:
    >>> sheet2.cell(2,2).value #1990/2/22 33656.0 >>> xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode) (1992, 2, 22, 0, 0, 0) >>> date_value =xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode) >>> date_value (1992, 2, 22, 0, 0, 0) >>> date(*date_value[:3]) datetime.date(1992, 2, 22) >>> date(*date_value[:3]).strftime('%Y/%m/%d') '1992/02/22'

    即可以做下简单处理,判断ctype是否等于3,如果等于3,则用时间格式处理:

    if (sheet.cell(row,col).ctype == 3):
        date_value = xlrd.xldate_as_tuple(sheet.cell_value(rows,3),book.datemode)
        date_tmp = date(*date_value[:3]).strftime('%Y/%m/%d')

    问题三:

      问题描述:读取合并单元格内容中内容sheet2.cell(2,4).ctype返回的值是0,说明这个单元格的值是空值,这就是这个包不完善的地方,如果是合并单元格那么应该合并的单元格内容一样,但是它只是合并的第一个单元格有值,其它为空。

      解决办法:通过获取merge_cells返回的row和col低位的索引来判断哪些是合并单元格,然后做后续取值操作。

        读取文件的时候需要将formatting_info参数设置为True,默认是False,所以上面获取合并的单元格数组为空,

        详细查看该链接:https://www.cnblogs.com/zhoujie/p/python18.html

    2.为什么使用xlrd模块?

      ♦在UI自动化或者接口自动化中数据维护是一个核心,所以此模块非常实用。

    3.怎样使用xlrd模块?

      读取表格数据样例https://www.cnblogs.com/iamjianghao/p/10764473.html

      python selenium中Excel数据维护:https://www.cnblogs.com/insane-Mr-Li/p/9093212.html

      

      

  • 相关阅读:
    python学习(二十三) String(下) 分片和索引
    python学习(二十二) String(上)
    微服务网关
    【转】linux 软连接 硬链接
    设计模式--观察者模式
    设计模式--策略模式
    ubuntu-server 安装redis
    【转】linux的hostname修改详解
    【转】ftp的两种模式
    【转】linux下find查找命令用法
  • 原文地址:https://www.cnblogs.com/iamjianghao/p/10764415.html
Copyright © 2011-2022 走看看