zoukankan      html  css  js  c++  java
  • python使用openpyxl获取合并单元格的值

    问题

    假设在test.xlsx的“Sheet1”工作表中,A1:D3区域的值如下:

    要求给定指定的行、列以及对应的工作表作为参数,能够正确解析合并单元格,获取指定单元格的值

    如果直接根据行列获取对应单元格的值,则合并单元格非左上角的其他单元格都会获取到None值,如下:

    if __name__ == "__main__":
        wb = xl.load_workbook("test.xlsx")
        sheet_ = wb["Sheet1"]
        print(sheet_["A1"].value)  # 1
        print(sheet_["A2"].value)  # None
        print(sheet_["D1"].value)  # 8
        print(sheet_["D2"].value)  # None
        print(sheet_["D3"].value)  # None

    解决思路

    获取到对应单元格后,判断该单元格是否为合并单元格,如果是,则找到该合并区域并获取左上角的值返回。

    通过 sheet.merged_cell_ranges属性,可以获取当前工作表所有的合并区域列表:

    测试代码:

    if __name__ == "__main__":
        wb = xl.load_workbook("test.xlsx")
        sheet_ = wb["Sheet1"]
        merged_ranges = sheet_.merged_cell_ranges  # 获取当前工作表的所有合并区域列表
        for merged_range in merged_ranges:
            print(type(merged_range))  # 打印区域对象类型
            print(merged_range)  # 打印区域

    结果如下:

     我们巡着openpyxl.worksheet.merge.MergedCellRange查找其源码,发现定义了in操作,可以直接通过in确认某个坐标是否位于区域内

    这时候我们已经基本具备获取合并单元格的条件了。

    完整代码如下:

    import openpyxl as xl
    from openpyxl.worksheet.worksheet import Worksheet
    from openpyxl.cell import MergedCell
    
    
    def parser_merged_cell(sheet: Worksheet, row, col):
        """
        检查是否为合并单元格并获取对应行列单元格的值。
        如果是合并单元格,则取合并区域左上角单元格的值作为当前单元格的值,否则直接返回该单元格的值
        :param sheet: 当前工作表对象
        :param row: 需要获取的单元格所在行
        :param col: 需要获取的单元格所在列
        :return: 
        """
        cell = sheet.cell(row=row, column=col)
        if isinstance(cell, MergedCell):  # 判断该单元格是否为合并单元格
            for merged_range in sheet.merged_cell_ranges:  # 循环查找该单元格所属的合并区域
                if cell.coordinate in merged_range:
                    # 获取合并区域左上角的单元格作为该单元格的值返回
                    cell = sheet.cell(row=merged_range.min_row, column=merged_range.min_col)
                    break
        return cell
    
    
    if __name__ == "__main__":
        wb = xl.load_workbook("test.xlsx")
        sheet_ = wb["Sheet1"]
    
        for row_index in range(1, 4):
            for col_index in range(1, 5):
                cell_ = parser_merged_cell(sheet_, row_index, col_index)
                print("第%s行第%s列:%s" % (row_index, col_index, cell_.value))

    结果如下:

    第1行第1列:1
    第1行第2列:2
    第1行第3列:3
    第1行第4列:8
    第2行第1列:1
    第2行第2列:4
    第2行第3列:5
    第2行第4列:8
    第3行第1列:6
    第3行第2列:7
    第3行第3列:7
    第3行第4列:8
  • 相关阅读:
    LIB和DLL
    string
    Lists
    ctypes常用dll
    tomcat的安装配置注意事项
    tomcat6的简单安装
    存储GFS 学习笔记
    进程是否启动查看命令方法
    (转载)最新linux搭建gfs系统iscsi+GFS实现网络存储
    推荐两款支持在linux下运行ASP.NET网站的国产免费WEB服务器软件
  • 原文地址:https://www.cnblogs.com/SunboyL/p/14738690.html
Copyright © 2011-2022 走看看