zoukankan      html  css  js  c++  java
  • Python 导入分部分项前的 数据处理 2

    
    import os
    import openpyxl
    from openpyxl import Workbook
    from copy import deepcopy
    
    
    # 原文:https://www.cnblogs.com/liuda9495/p/9039732.html
    
    
    
    
    #workbook2 = Workbook()
    workbook2 = openpyxl.load_workbook('五分部.xlsx')# 加载excel
    workbook = None
    worksheet = None
    unit_name = None
    
    
    
    
    def each_files():    
        pathDir =  os.listdir('./files/')
        for index, value in enumerate(pathDir):
            filepath2 = './files/' + value
            print(filepath2)
            each_sheet(filepath2)
    
    
    
    
    def each_sheet(path):
        global workbook
        global worksheet
        
        workbook = openpyxl.load_workbook(path)# 加载excel
        name_list = workbook.sheetnames# 所有sheet的名字    
        for sheetname in name_list:
            print(sheetname)
            worksheet = workbook[sheetname]# 读取第一个工作表
            CellSplit()
            Business()
    
    
    
    
    def CellSplit():
        
        # 获取所有 合并单元格的 位置信息
        # 是个可迭代对象,单个对象类型:openpyxl.worksheet.cell_range.CellRange
        # print后就是excel坐标信息
        m_list = worksheet.merged_cells
    
        l = deepcopy(m_list)# 深拷贝
    
        # 拆分合并的单元格 并填充内容
        for m_area in l:
            
            # 这里的行和列的起始值(索引),和Excel的一样,从1开始,并不是从0开始(注意)
            r1, r2, c1, c2 = m_area.min_row, m_area.max_row, m_area.min_col, m_area.max_col
                
            worksheet.unmerge_cells(start_row=r1, end_row=r2, start_column=c1, end_column=c2)
            print('区域:', m_area, '  坐标:', r1, r2, c1, c2)
            
            # 获取一个单元格的内容
            first_value = worksheet.cell(r1, c1).value
    
            # 数据填充
            for r in range(r1, r2+1):# 遍历行        
                if c2 - c1 > 0:# 多个列,遍历列
                    for c in range(c1, c2+1):
                        worksheet.cell(r, c).value = first_value
                else:# 一个列
                    worksheet.cell(r, c1).value = first_value
        
    
    
    
    
    def Business():# 特定的业务逻辑
        global worksheet2
        global workbook2
        global unit_name
        
        # 获取单位工程的名字
        unit_name = worksheet.cell(5, 1).value
        '''
        unit_name = worksheet.cell(2, 1).value
        nPos = unit_name.find(':')
        unit_name = unit_name[nPos+1:]
        '''    
        worksheet.title = unit_name# 改sheet的名字
    
        
        '''
        # 针对无单位工程的excel,这种情况先不考虑
        worksheet.insert_cols(1)# 插入列
        for index in range(worksheet.max_row):# 首列批量填充数据
            r = index+1
            worksheet.cell(r, 1).value = unit_name
        worksheet.cell(3, 1).value = '单位工程'# 单元格赋值
        '''
    
        # 删除行
        worksheet.delete_rows(4)
        worksheet.delete_rows(2)
        worksheet.delete_rows(1)
    
        # 删除列
        worksheet.delete_cols(5)
        worksheet.delete_cols(3)
    
        worksheet2 = workbook2.create_sheet(unit_name)
        for x in range(worksheet.max_row):
            r = x+1
            for y in range(worksheet.max_column):
                c = y+1
                worksheet2.cell(r, c).value = worksheet.cell(r, c).value
    
    
    
    
            
    
    
    each_files()
    workbook2.save('五分部2.xlsx')
    
    
    
    

    excel格式要求:

  • 相关阅读:
    grafana里prometheus查询语法
    Linux 高频工具快速教程
    国内开源镜像站点汇总
    Oracle DBLINK 简单使用
    启动OpenOffice服务
    使用openoffice转pdf,详细
    ORACLE数据库误操作执行了DELETE,该如何恢复数据?
    一个 介绍 superset Kylin 以及大数据生态圈的 博文
    Kylin介绍 (很有用)
    找到一些经验,关于使用thymeleaf时遇到的一些问题
  • 原文地址:https://www.cnblogs.com/guxingy/p/13203532.html
Copyright © 2011-2022 走看看