背景:A表内容如下,根据B列字段分类,拆分成多个表(工作簿)
环境配置:需要安装pandas,xlrd,openpyxl库
参考教程:Pandas之read_excel()和to_excel()函数解析
#将一个excel表根据某列字段拆分为多个工作表 import pandas as pd io="C:/.../_all.xlsx" #A表路径 data=pd.read_excel(io,0) rows=data.shape[0] #获取行数,shape[1]获取列数 target_col="Business Process" #要拆分的列 cols_list=[] for i in range(rows): temp=data[target_col][i] if temp not in cols_list: cols_list.append(temp) #同一类放在一个列表中 for col in cols_list: new_df=pd.DataFrame() for i in range(0,rows): if data[target_col][i]==col: new_df=pd.concat([new_df,data.iloc[[i],:]],axis=0,ignore_index=True) #保存新文件 new_df.to_excel(r"C:/.../1/" +str(col)+".xlsx",sheet_name=col,index=False)
拆分完成,总共有6类,拆分成6个文件
背景:表数据如下,根据B列字段,拆分成多个sheet
#将一个excel工作表根据条件拆分成多个sheet import openpyxl import pandas as pd test1='C:/Users/wangxi3/Desktop/undo/test1.xlsx' df=pd.DataFrame(pd.read_excel(test1,0,dtype=object)) writer=pd.ExcelWriter(test1) wb=openpyxl.load_workbook(test1) writer.book=wb for groupname,groupdf in df.groupby('name'): groupdf.to_excel(writer,sheet_name=groupname,index=False) writer.save() writer.close() wb.close()
拆分完成