zoukankan      html  css  js  c++  java
  • python----openpyxl模块

    一、openpyxl的介绍和安装

    1.介绍

    openpyxl是一个用来读写xlsx文件的Python库,官方文档https://openpyxl.readthedocs.io/en/stable/tutorial.html.

    在使用openpyxl前先要掌握三个对象,即:Workbook(工作簿,一个包含多个Sheet的Excel文件)、Worksheet(工作表,一个Workbook有多个Worksheet,用表名识别,如“Sheet1”,“Sheet2”等)、Cell(单元格,存储具体的数据对象)三个对象。

    2.安装

    pip install openpyxl

    二、工作薄基本操作

    1.创建一个工作薄

    from openpyxl import Workbook
    wb = Workbook()  #创建一个工作簿,默认也至少创建了一个工作表
    ws = wb.active   #获得正在运行的工作表,默认第0张;如果是已经存在的工作薄,获得的是打开Excel显示的工作表

    2.打开已存在的工作簿

    from openpyxl import load_workbook
    wb = load_workbook("文件名称.xlsx")  #打开一个已存在的工作薄

    3.保存工作簿

    wb.save("文件名称.xlsx")  #保存工作簿,不写路径保存在当前文件夹

    三、工作表的基本操作

    1.创建表

    ws1 = wb.create_sheet()  #创建一个工作表,默认位置是最后一个,默认名称是Sheet1(如果前面只有一张工作表);返回工作表
    ws2 = wb.create_sheet("test",0) #创建一个工作表,表名是test,位置是第一个
    ws3 = wb.create_sheet(title="test2",-1) #创建工作表,表名是test2,位置是倒数第二位

    2.选择表

    ws1 = wb["test"]  #选择表名是test的工作表
    ws2 = wb.get_sheet_by_name("test")  #选择表名是test的工作表

    3.表名

    title = ws.title  #获取工作表的表名
    ws.title = "newtitle"   #修改工作表的表名是newtitle
    wb.sheetnames    #获取所有的工作表名称,返回一个列表
    wb.get_sheet_names()   #获取所有的工作表名称,返回一个列表
    for sheet in wb:   #打印所有工作表名称
        print(sheet)

    4.工作表的标签颜色

    ws.sheet_properties.tabColor = "B22222"  #设置工作表标签的背景颜色,使用RGB颜色16进制,RGB颜色参考https://tool.oschina.net/commons?type=3

    5.删除工作表

    del wb["Sheet2"]   #删除title是Sheet的工作表
    wb.remove(wb["Sheet2"])   #删除title是Sheet2的工作表

    6.复制工作表

    ws = wb.copy_worksheet("wb["Sheet"])   #复制Sheet工作表,默认名称是Sheet Copy
    ws.title = "Sheet的副本"    #把复制的工作表重命名为Sheet的副本

    四、单元格的基本操作

    1.获取单个单元格

    #获取单个单元格
    cell = ws["A1"]  #获取A1单元格,返回单元格<Cell 'Sheet1'.A1>
    a = ws["A1"].value   #获取A1单元格的值
    
    a = ws.cell(row=1,column=1).value   #获取A1单元格的值,也可以直接写ws.cell(1,1)第一个参数是行数,第二个参数是列数

    2.按行或是按列获取单元格

    #按行或是列获取
    cells = ws["B"]  #获取第二列的单元格,返回一个元组;有数据或是格式都会被获取
    for cell in cells:
        print(cell.value)   #打印第二列单元格的值
    
    cells = ws[2]  #获取第二行的单元格,返回一个元组
    
    #打印奇数行第二列的单元格的数据
    for i in range(1,20,2):
        print(ws.cell(i,2).value)

    3.获取所有单元格

    #获取所有单元格
    cells = list(ws.values)   #ws.values获取所有的单元格数据,返回一个生成器,list生成一个列表;列表里面是元组,每行数据组成一个元组
    #再对cells进行切片,可以按行获取单元格
    cells1 = list(ws.values)[1:3] #获取第二行和第三行
    #按行打印所有的单元格
    for row in ws.rows: #ws.rows返回一个生成器,返回工作表的所有行,每一行单元格由一个元组包裹;ws.rows直接写成ws也是一样的效果
      for cell in row:
        print(cell.value)
    #按列打印所有的单元格
    for column in ws.columns: #ws.columns返回一个生成器,返回工作表的所有列,每列单元格由一个元组包裹
      for cell in column:
        print(cell.value)

    4.获取区域单元格

    #获取区域单元格
    cells = ws["A1":"C5"]  #获取A1到C5区域,返回列表,列表里面是元组,每行单元格组成一个元组
    for row in cells:
        for cell in row:
            print(cell.value)  #按行打印
    #按行
    cells = ws[5:10]  #获取第5到10行单元格,返回列表,列表里面是元组,每行单元格组成一个元组
    #按列
    cells = ws["A:C"]  #获取第A列到第C列,返回列表,列表里面是元组,每列单元格组成一个元组
    
    #按行
    cells = ws.iter_rows(min_row=2,min_col=2,max_row=4,max_col=4)  #按行获取单元格,返回列表,列表里面是元组,每行单元格组成一个元组
    #按列
    cells = ws.iter_cols(min_row=2,min_col=2,max_row=4,max_col=4)  #按列获取单元格,返回列表,列表里面是元组,每列单元格组成一个元组

    5.数字字母转换

    #Excel的列用字母表示,有时需要转换字母和数字
    #数字转字母
    a = openpyxl.utils.get_column_letter(23)
    print(a)
    #字母转数字
    b = openpyxl.utils.column_index_from_string("h")
    print(b)

    6.获取最大行和最大列

    #获取工作表的做大行最大列
    max_row = ws.max_row  #获取工作表的最大行,返回数字
    max_column = ws.max_column  #获取工作表的最大列,返回数字
    #用最大行和最大列来按行获取工作表数据
    for row in range(1,max_row+1):
      for col in range(1,max_col+1):
        print(ws.cell(row,col).value)

    7.写入单元格

    #写入单元格
    ws["A1"] = 1  #在A1位置写入1
    ws["A2"].value = 2  #在A2位置写入2
    ws.cell(3,1,value=3)  #在第3行第1列(A3)写入3
    ws.append([1,2,3,4])  #在最后一行的下一行写入,即在A4写入1,B4写入2...

    8.插入或删除

    #插入行
    ws.insert_rows(idx=2,amount=3)  #在第2行前插入3行,也可以省略idx和amount
    #插入列
    ws.insert_columns(2,3)   #在第2列前插入3列
    #删除行
    ws.delete_rows(2,3)    #删除第2行开始的3行
    #删除列
    ws.delete_columns(2,3)   #删除第2列开始的3列

    9.移动单元格

    #移动单元格,rows是正数,向下移动,负数向上移动;cols是正数向右移动,负数向左移动
    ws.move_ range("A1:B3",rows=10,cols=10)  #把"A1:B3"单元格向下移10行,向右移10行;移动之前的位置变为空,移动之后的位置如果之前有数据,覆盖原数据

    10.冻结单元格

    #冻结单元格,如果要冻结首行就写"A2",如果要冻结上面2行和左边2列,就写"C3"
    ws.freeze_panes = "A2"   #冻结首行

    五、实例

    1.将每张表中固定单元格的数据聚合

    #求一月、二月、三月的D9单元格的和
    from openpyxl import load_workbook
    
    wb = load_workbook("实例1.xlsx")
    list = []
    for sheet in wb.worksheets:
        list.append(sheet["D9"].value)
    print(list)
    sum1 = sum(list)
    print(sum1)
    
    #列表推导式
    sum2 = sum([sheet["D9"].value for sheet in wb.worksheets])
    print(sum2)

    2.按行或是按列聚合

          

    #按行或是按列聚合,加入总分和平均分
    from openpyxl import load_workbook
    
    wb = load_workbook("实例2.xlsx")
    ws = wb.active
    max_row = ws.max_row  #获取最大行号
    max_col = ws.max_column  #获取最大列号
    #在列后加入总分
    ws.cell(1,column = max_col+1,value="总分")   #在最大列后面写入“总分”
    for row in ws.iter_rows(min_row=2,min_col=2,max_col=max_col):   #选取分数的范围
        list = []
        row_index = row[0].row  #获得行号,返回数字
        for col in row:
            list.append(col.value)
        ws.cell(row_index,max_col+1,value=sum(list)) #在每一行的最后写入总分
    
    #在行后加入单科平均分
    ws.cell(max_row+1,1,value="单科平均分")
    for col in ws.iter_cols(min_row=2,min_col=2,max_row=max_row):
        col_index = col[0].column  #获取列号,返回数字
        list = [cell.value for cell in col]  #列表推导式获取范围内每列的数字
        ws.cell(max_row+1,col_index,value=round(sum(list)/len(list),2))  #写入平均分,且保存2位小数;round(a,2)a保存2位小数
    wb.save("实例2.xlsx")

    3.筛选

         

    #筛选
    from openpyxl import load_workbook
    
    wb = load_workbook("实例2.xlsx")
    ws = wb["Sheet2"]
    for row in ws.iter_rows(min_row=2,min_col=2):
        for cell in row:
            print(cell.value)
            if cell.value == None:   #如果单元格的值是空,写入“缺考”
                cell.value = "缺考" 
            elif cell.value < 60:   #如果单元格的值小于60,加上“(不及格)”
                cell.value = str(cell.value) + "(不及格)"              
    wb.save("实例2.xlsx")
    #删除低于总分低于250的行
    from openpyxl import load_workbook
    
    wb = load_workbook("实例2.xlsx")
    ws = wb["Sheet3"]
    for row in range(ws.max_row,1,-1):  #row表示行号,因为Excel删除一行之后,下面的数据会上移,行号会变,所以要从下往上删除
        s = sum([cell.value for cell in ws[row][1:]])  #除去第一列,计算一行数据的和为总分
        if s < 250:
            ws.delete_rows(row)
    wb.save("实例2.xlsx")

    4.将单表拆成多表

        

    #将表格按班级拆分
    from openpyxl import load_workbook
    
    wb = load_workbook("实例3.xlsx")   #打开工作薄
    ws = wb.active  #获取工作表
    dict = {}  #字典记录工作表数据
    for row in ws.iter_rows(min_row=2):  #获取第二行开始的所有行数据
        row_data = [cell.value for cell in row]  #列表推导式获得每行的数据
        if row_data[1] in dict.keys():   #如果班级在字典的键里;row_data表示班级,以班级为键;
            dict[row_data[1]] += [row_data]   #把行数据添加到键的值里面;需要把列表再用一层列表包裹,包裹之后会把列表整个添加;不然+会把列表里的值一个个添加
        else:
            dict[row_data[1]] = [[cell.value for cell in ws[1]]]   #如果班级不在键里,先加上表格第一行的表头
            dict[row_data[1]] += [row_data]  #再添加行数据
    for key,value in sorted(dict.items()):  #把字典进行排序
        ws = wb.create_sheet(key)  #创建工作表,表名是键名
        for data in value:  #添加数据
            ws.append(data)
    wb.save("实例3.xlsx")

    六、单元格的其他操作

    1.合并单元格和取消合并

    ws.merge_cells("A1:C5")  #合并A1到C5的单元格,如果都有数据,保留A1的数据
    ws.merge_cells(start_row=1,end_row=5,start_column=1,end_column=3)  #合并A1到C5的单元格
    ws.unmerge_cells("A1:C5")  #取消合并单元格

    2.公式

    打开工作薄用data_only=False(默认),写入公式之后,保存文件;再用data_only=False打开,打印单元格的value是公式;用data_only=True打开,打印value是None。

    要获取单元格的value是数字,要手动打开Excel之后保存,再用data_only=True打开,打印单元格的value是数字,不能保存;用data_only=True打开之后保存,就只有数字没有公式了。

    from openpyxl import load_workbook
    
    wb = load_workbook("实例2.xlsx")
    ws = wb["Sheet4"]
    ws["D6"] = "=sum(D2:D5)"  #使用excel公式
    print(ws["D6"].value)   #打印出来的值是公式=sum(D4+D5)
    wb.save("实例2.xlsx")
    #如果要读取出数据,需要手动打开Excel表保存,openpyxl打开Excel时使用data_only=True,不保存
    wb = load_workbook("实例2.xlsx")
    print(wb["D6"])   #打印数字

    3.分组

    ws.column_dimensions.group("A","C")  #按列分组,A到C列为一组
    ws.row_dimensions.group(1,3,hidden=True)  #按行分组,1到3行为一组,hidden=True表示隐藏分组的行

     4.批注

    #批注
    c = openpyxl.comments.Comment("这是一个注释","张三")  #Comment(text, author, height=79, width=144)   
    ws["K1"].comment = c  #给单元格设置批注

    5.字体

    Font(name=None, sz=None, b=None, i=None, charset=None, u=None, strike=None, color=None, scheme=None, family=None, size=None, bold=None, italic=None, strikethrough=None, underline=None, vertAlign=None, outline=None, shadow=None, condense=None, extend=None)

    •  name:字体名称,中文字体名称前面要加u;例u"微软雅黑"
    • sz/size:字体大小,单位px
    • b/bold:是否加粗;True加粗,False不加粗
    • i/italic:是否倾斜;True倾斜,False不倾斜
    • u/underline:下划线;single单下划线,double双下划线,singleAccounting会计用单下划线,doubleAccounting会计用双下划线
    • strike/strikethrough:是否显示删除线,True显示删除线,False不显示删除线
    • verAlign:superscript上标,subscript下标,baseline
    • color:字体颜色,RGB颜色十六进制表示
    #设置字体
    f = openpyxl.styles.Font(name=u"微软雅黑",sz=16,bold=True,vertAlign="baseline",color="DC143C")
    ws["A1"].font = f  #只能设置单个单个单元格,如果需要设置区域,要循环设置
    #获取字体
    f1 = ws["A1'].font

    6.对齐

    Alignment(horizontal=None, vertical=None, textRotation=0, wrapText=None, shrinkToFit=None, indent=0, relativeIndent=0, justifyLastLine=None, readingOrder=0, text_rotation=None, wrap_text=None, shrink_to_fit=None, mergeCell=None)

    • horizontal:水平对其方式;"general"常规, "left"靠左, "center"居中, "right"靠右, "fill"填充, "justify"两端对齐, "centerContinuous"跨列剧中, "distributed"分散对齐
    • vertical:垂直对齐方式;"top"顶部, "center"居中, "bottom"底部, "justify"两端对齐, "distributed"分散对齐
    • textRotation/text_rotation:指定文本旋转角度
    • wrapText/wrap_text:是否自动换行
    • shrinkToFit/shrink_to_fit:是否缩小字体填充
    • indent:指定缩进
    #设置对齐
    a = openpyxl.styles.Alignment(horizontal = "center",vertical = "center")
    ws["c1"].alignment = a

    7.边框

    Side(style=None, color=None, border_style=None)

    • style:边线样式;'dashDot','dashDotDot', 'dashed','dotted', 'double','hair', 'medium', 'mediumDashDot', 'mediumDashDotDot','mediumDashed', 'slantDashDot', 'thick', 'thin'
    • color:边线颜色

    Border(left=None, right=None, top=None, bottom=None, diagonal=None, diagonal_direction=None, vertical=None, horizontal=None, diagonalUp=False, diagonalDown=False, outline=True, start=None, end=None)

    • left:左边框
    • right:左边框
    • top:上边框
    • bottom:下边框
    • diagonal:对角线
    #边框
    s = openpyxl.styles.Side(style = "medium",color = "FF69B4")  #设置边线样式
    b = openpyxl.styles.Border(left = s, right = s, top = s, bottom = s)  #设置边框
    ws["c2"].border = b

    8.填充

    PatternFill(patternType=None, fgColor=Color(), bgColor=Color(), fill_type=None, start_color=None, end_color=None)

    • patternType/fill_type:填充样式;'none'不填充,'solid'实心填充,'darkGray'75%灰色,'mediumGray'50%灰色,'lightGray'25%灰色
    • fgColor/start_color:前景颜色
    • bgColor/end_color:背景颜色
    #填充
    f = openpyxl.styles.PatternFill(fill_type = "mediumGray", end_color ="FF69B4")
    f1 = openpyxl.styles.PatternFill(fill_type = "mediumGray",start_color = "FF69B4")
    ws["C3"].fill = f
    ws["C4"].fill = f1

    9.设置行高和列宽

    Excel的默认行高是13.5,默认列宽是8.38;即使行高和列宽被设为0,行高最小也是13.5,列宽最小是8.38

    #行高,行高的单位是磅,1个单位=0.3612毫米
    ws.row_dimensions[3].height = 50  #设置工作表的第三行的高度是50个单位
    #列宽,列宽的单位是0.1英寸,一个单位=2.2862毫米
    ws.column_dimensions["C"].width = 50   #设置工作表的C列是50个单位

    10.插入图片

    #插入图片;必须安装Pillow库,不然会报错"You must install Pillow to fetch image objects"
    img = openpyxl.drawing.image.Image("E:\图\1\1.jpg")  #创建图片对象
    img.height = 100  #设置图片的高,单位是px
    img.width = 100  #设置图片的宽,单位是px
    ws.add_image(img,"A10")  #在A10位置插入图片

    11.插入图表

    11.1 柱状图

    #制作柱状图
    from openpyxl import load_workbook
    from openpyxl import chart
    
    wb = load_workbook("实例3.xlsx")
    ws = wb["Sheet1"]
    
    #创建一个柱状表对象
    c = chart.BarChart()
    #设定数据范围
    data = chart.Reference(ws,min_row = 1, max_row = 4, min_col = 2, max_col = 4)
    #设置x轴的项目
    x = chart.Reference(ws, min_row = 2, max_row = 4, min_col = 1)
    #柱状图添加数据
    c.add_data(data,titles_from_data=True)
    #柱状图添加X轴
    c.set_categories(x)
    #在工作表中添加柱状图
    ws.add_chart(c,"F1")
    
    wb.save("实例3.xlsx")

    11.2 折线图

    # 制作折线图
    from openpyxl import load_workbook
    from openpyxl import chart
    
    wb = load_workbook("实例4.xlsx")
    ws = wb.active
    #创建一个折线图对象
    c = chart.LineChart()
    #设定数据范围
    data = chart.Reference(ws, min_row=2, max_row=3, min_col=1, max_col=13)
    #设置x轴项目
    x = chart.Reference(ws, min_row=1, min_col=2, max_col=13)
    c.add_data(data, from_rows=True, titles_from_data=True)  #因为title在行首,from_rows=True
    c.set_categories(x)
    #在工作表的B5位置添加折线图
    ws.add_chart(c,"B5")
    wb.save("实例4.xlsx")

    11.3 饼状图

    #饼图
    from openpyxl import load_workbook
    from openpyxl import chart
    
    wb = load_workbook("实例4.xlsx")
    ws = wb["Sheet2"]
    pie = chart.PieChart()
    data = chart.Reference(ws, min_row=2, max_row=7, min_col=2)
    x = chart.Reference(ws, min_row=2, max_row=7, min_col=1)
    pie.add_data(data)
    pie.set_categories(x)
    pie.title = "饼状图"   #设置饼状图的标题
    ws.add_chart(pie,"D1")
    wb.save("实例4.xlsx")
  • 相关阅读:
    微信用户授权,获取code
    关于swiper在vue中不生效的问题
    ES6-Set 和 Map 数据结构
    Js中caller和callee的区别
    类与对象基础总结--继承,多态
    java 类与对象基础整理
    java 的数据库操作--JDBC
    Socket的长连接和短连接
    java 的底层通信--Socket
    算法--树与递归
  • 原文地址:https://www.cnblogs.com/he-202007/p/14338762.html
Copyright © 2011-2022 走看看