zoukankan      html  css  js  c++  java
  • 【练习读写excel文件】根据某一字段将相同的类拆分

    背景:A表内容如下,根据B列字段分类,拆分成多个表(工作簿)

    环境配置:需要安装pandas,xlrd,openpyxl库

    参考教程:Pandas之read_excel()和to_excel()函数解析

    #将一个excel表根据某列字段拆分为多个工作表
    
    import pandas as pd
    
    io="C:/.../_all.xlsx"  #A表路径
    data=pd.read_excel(io,0)
    
    rows=data.shape[0]      #获取行数,shape[1]获取列数
    target_col="Business Process"  #要拆分的列
    cols_list=[]
    
    for i in range(rows):
        temp=data[target_col][i]
        if temp not in cols_list:
            cols_list.append(temp)  #同一类放在一个列表中
    
    for col in cols_list:
        new_df=pd.DataFrame()
    
        for i in range(0,rows):
            if  data[target_col][i]==col:
                new_df=pd.concat([new_df,data.iloc[[i],:]],axis=0,ignore_index=True)
       
        #保存新文件
        new_df.to_excel(r"C:/.../1/" +str(col)+".xlsx",sheet_name=col,index=False)        

    拆分完成,总共有6类,拆分成6个文件

     背景:表数据如下,根据B列字段,拆分成多个sheet

    #将一个excel工作表根据条件拆分成多个sheet
    import openpyxl
    import pandas as pd
    
    test1='C:/Users/wangxi3/Desktop/undo/test1.xlsx'
    df=pd.DataFrame(pd.read_excel(test1,0,dtype=object))
    
    writer=pd.ExcelWriter(test1)
    
    wb=openpyxl.load_workbook(test1)
    writer.book=wb
    
    for groupname,groupdf in df.groupby('name'):
        groupdf.to_excel(writer,sheet_name=groupname,index=False)
    
    writer.save()
    writer.close()
    wb.close()

    拆分完成

  • 相关阅读:
    创建可管理的对象属性
    解析简单xml文档
    定义类的__slots__属性节省内存的开销
    读写json数据
    读写csv,excel文件数据
    常用的字符串处理方法
    sql中case when 的使用
    对字典的处理
    元组的元素命名
    列表,字典,集合按条件筛选
  • 原文地址:https://www.cnblogs.com/xiaopc/p/12767241.html
Copyright © 2011-2022 走看看