zoukankan      html  css  js  c++  java
  • 使用Python操作Excel文档(一)

    Python | 使用Python操作Excel文档(一)

    0 前言

    在阅读本文之前,请确保您已满足或可能满足以下条件:

    1. 请确保您具备基本的Python编程能力。

    2. 请确保您会使用Excel。

    3. 请确保您的电脑已经安装好Python且pip可用。

    另外操作Excel需要使用openpyxl模块,请安装好该模块:

    pip install openpyxl

    演示环境:

    1. 演示环境为win10+Python3.6

    2. openpyxl版本为2.6.2

    3. 调试工具为IDLE

    1. openpyxl简述

    openpyxl操作Excel的第三方库,作者是Eric Gazoni, Charlie Clark。您也可以访问openpyxl的官方网站通过官方手册进行学习。同时附上官方网站的地址:

    https://openpyxl.readthedocs.io/en/stable/index.html。

    目前openpyxl的最新版本是2.6.2版本。在openpyxl之前,我们使用xlrd和xlwt来操作Excel表格,事实上这两个库也非常好用,一读一写,然而遗憾的是它们只能操作2003及以前的版本,而openpyxl却能支持2010版本。

    另外这里附上源码地址,感兴趣的同学可以自行下载学习或者参与开发:

    http://bitbucket.org/openpyxl/openpyxl/src

    2. 创建/读取一个Excel工作簿

    我们知道一个xlsx文件叫做工作簿,工作簿中的每一张表叫做工作表,表中每个格叫做单元格。

    创建工作簿,示例代码如下:

    from openpyxl import Workbook
    wb = Workbook().save("example.xlsx")

    Workbook对象是一个用来创建一个工作簿,save方法用来将这个对象保存成一个文件。

    可以查看一下,程序执行的目录下是不是出现了一个example.xlsx文件。这时,是一个全新的文件,里面只有一张默认的表。

    读取已存在的xlsx文件,使用openpyxl中的load_wordbook()方法。示例代码如下:

    from openpyxl import load_workbook
    wb = load_workbook("example.xlsx")

    4. 操作Excel表:读取,创建,删除,复制

    每个工作表都是一个Worksheet对象。

    首先访问wb的sheetnames属性来获取文件中的所有工作表的名字,:

    wb.sheetnames # ['Sheet']

    一般来说,当我们打开一个Excel表格,会看到上次我们保存的表。这个表是活动状态的。我们可以使用Workbook类中的active属性来读取这张表。

    ws = wb.active 

    ws就是我们要操作的表了。你可以使用ws的title属性来获取表明,一般当我们创建一个xlxs文件的时候,会默认创建一张表Sheet,接下来我们对ws的操作,就是对这张表的操作,可以理解成对ws的操作会反映到这张表上。

    例如访问ws的title属性,可以获取或修改表名。ws是一个Worksheet对象,也可以使用Workbook类中的get_sheet_by_name("sheet_name")方法读取这张表。也可以使用wb[表名]的方式,但是旧版本的openpyxl可能会不知这种访问方式。使用title给这张表重命名:

    ws.title # 'Sheet'
    ws = wb.get_sheet_by_name("Sheet")
    ws.title # 'Sheet'
    ws.title = "demo"
    wb.sheetnames # ['demo']
    ws = wb["demo"]

    创建一张表,使用Workbook中的create_sheet()方法:

     ws1 = wb.create_sheet("demo1")
     wb.sheetnames # ['demo', 'demo1']

    删除一张表,使用Workbook中的remove_sheet()方法:

    wb.remove_sheet(ws1) 
    wb.sheetnames # ['demo']

    需要注意的是,也可以使用wb.remove(ws1)del w["demo1"],但是不建议这种写法。

    复制一张表,使用Workbook中的copy_worksheet()方法:

    ws2 = wb.copy_worksheet(ws)
    wb.sheetnames # ['demo', 'demo Copy']

    PS:旧版的openpyxl可能不支持sheetnames属性,这时可以使用Workbook类中的get_sheet_names()方法,旧版中也可能不支持wb[表名]的访问方式以及active属性,这时可以使用get_active_sheet()方法

    5. 操作单元格

    每个单元格都是一个Cell对象。

    访问单元格,需要使用坐标,坐标的表示方式有两种,一种是使用字符串,如‘A1’,表示的是第一列,第一行。。另一种就是使用标准得坐标如,column=1, row=1,利用ws中的cell方法来第一行第一列的单元格。访问单元格的方式是使用如ws['A1'], 即表变量[坐标]

    ws['A1'] = 0
    ws.cell(row=1, column=1, value=0)
    print(ws['A1'].value) # 0

    需要强调的是,虽然可以直接给单元格赋值,但是要读取这个值,还是需要访问Cell类中的value属性的。而且坐标必须从1开始。

    PS:部分旧版可能不支持表变量[坐标]的访问方式,这时,可以使用ws.Cell('A1')或ws.Cell(column=1, row=1)的方式来访问。

    6. 向表中写入大量数据

    for i in range(1, 20):
        for j in range(1, 20):
            ws.cell(i,j,value=i*j)

    需要注意的是,使用cell时,坐标至少是1,也就是说,大于0的整数。

    wb.save("example.xlsx")

    好,到这里,我们保存,来看下效果。

    7.复习下今天内容

    关于使用openpyxl操作Excel文档,应该要先了解openpyxl提供的三个类:

    • Workbook类用来创建工作簿、读取、创建,删除,复制工作表等。

    • load_workbook方法会读取已存在的工作簿,返回Workbook对象

    • Worksheet类用来进行表的操作,比如访问单元格。返回Cell对象。

  • 相关阅读:
    SpringBoot/SpringMVC Restful接口全局异常处理
    spring/springboot/springmvc启用GZIP压缩
    centos7启动SonarQube 8.6报错
    类型初始值设定项引发异常
    OCI is not properly installed on this machine (NOE1/INIT)
    动态调用webservice 此 XML 文档中禁用 DTD。
    系统缺少插件 系统插件已过期
    几种常见的函数
    MQTT 协议基本介绍
    etcd:从应用场景到实现原理的全方位解读【修订版】
  • 原文地址:https://www.cnblogs.com/valorchang/p/11460172.html
Copyright © 2011-2022 走看看