Python读写excel
对于python 处理excel 表格,这个日常工作的需求还是不少,于是查查资料,自己写写,总结一下,记录一下,下次遇到直接拿过来用,方便自己,方便大家。
好在python有读写excel package很方便。
- xlrd:用于读Excel文件
- xlwt:写Excel包,文件后缀名为.xls,最多只能存65536行数据(2的16次方)
- xlsxwriter:也是写Excel包,文件后缀名.xlsx,最大支持1048576(2的20次方)行数据,16384(2的14次方)列数据
- openpyxl:既能读也能写,非常厉害,还能插入删除一行一列,后缀名是.xlsx
一,xlrd,xlwt 使用
## 1,导入模块
import xlrd
## 2, 打开Excel文件读取数据
data = xlrd.open_workbook('excel.xls')
##3,获取一个工作表
table = data.sheets()[0] #通过索引顺序获取
table = data.sheet_by_index(0) #通过索引顺序获取
table = data.sheet_by_name(u'Sheet1')#通过名称获取
## 4,获取整行和整列的值(返回数组)
table.row_values(i)
table.col_values(i)
## 5,获取行数和列数
table.nrows
table.ncols
## 6,获取单元格
table.cell(0,0).value
table.cell(2,3).value
就我自己使用的时候觉得还是获取cell最有用,这就相当于是给了你一个二维数组,余下你就可以想怎么干就怎么干了。得益于这个十分好用的库代码很是简洁。但是还是有若干坑的存在导致话了一定时间探索。现在列出来:
1、首先就是我的统计是根据姓名统计各个表中的信息的,但是调试发现不同的表中各个名字貌似不能够匹配,开始怀疑过编码问题,不过后来发现是因为空格。因为在excel中输入的时候很可能会顺手在一些名字后面加上几个空格或是tab键,这样看起来没什么差别,但是程序处理的时候这就是两个完全不同的串了。我的解决方法是给每个获取的字符串都加上strip()处理一下。效果良好
2、还是字符串的匹配,在判断某个单元格中的字符串(中文)是否等于我所给出的的时候发现无法匹配,并且各种unicode也不太奏效,百度过一些解决方案,但是都比较复杂或是没用。最后我采用了一个比较变通的方式:直接从excel中获取我想要的值再进行比较,效果是不错就是通用行不太好,不过问题还没解决。
#导入xlwt模块
import xlwt
# 创建一个Workbook对象,这就相当于创建了一个Excel文件
book = xlwt.Workbook(encoding='utf-8', style_compression=0)
'''
Workbook类初始化时有encoding和style_compression参数
encoding:设置字符编码,一般要这样设置:w = Workbook(encoding='utf-8'),就可以在excel中输出中文了。
默认是ascii。当然要记得在文件头部添加:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
style_compression:表示是否压缩,不常用。
'''
#创建一个sheet对象,一个sheet对象对应Excel文件中的一张表格。
# 在电脑桌面右键新建一个Excel文件,其中就包含sheet1,sheet2,sheet3三张表
sheet = book.add_sheet('test', cell_overwrite_ok=True)
# 其中的test是这张表的名字,cell_overwrite_ok,表示是否可以覆盖单元格,其实是Worksheet实例化的一个参数,默认值是False
# 向表test中添加数据
sheet.write(0, 0, 'EnglishName') # 其中的'0-行, 0-列'指定表中的单元,'EnglishName'是向该单元写入的内容
sheet.write(1, 0, 'Marcovaldo')
txt1 = '中文名字'
sheet.write(0, 1, txt1.decode('utf-8')) # 此处需要将中文字符串解码成unicode码,否则会报错
txt2 = '马可瓦多'
sheet.write(1, 1, txt2.decode('utf-8'))
# 最后,将以上操作保存到指定的Excel文件中
book.save(r'e:\test1.xls') # 在字符串前加r,声明为raw字符串,这样就不会处理其中的转义了。否则,可能会报错
建议还是用ascii编码,不然可能会有一些诡异的现象。
二,xlsxwriter使用
#coding:utf-8
import xlsxwriter
workbook=xlsxwriter.Workbook('demo1.xlsx')#创建一个excel文件
worksheet=workbook.add_worksheet(u'sheet1')#在文件中创建一个名为TEST的sheet,不加名字默认为sheet1
worksheet.set_column('A:A',20)#设置第一列宽度为20像素
bold=workbook.add_format({'bold':True})#设置一个加粗的格式对象
worksheet.write('A1','HELLO')#在A1单元格写上HELLO
worksheet.write('A2','WORLD',bold)#在A2上写上WORLD,并且设置为加粗
worksheet.write('B2',U'中文测试',bold)#在B2上写上中文加粗
worksheet.write(2,0,32)#使用行列的方式写上数字32,35,5
worksheet.write(3,0,35.5)#使用行列的时候第一行起始为0,所以2,0代表着第三行的第一列,等价于A4
worksheet.write(4,0,'=SUM(A3:A4)')#写上excel公式
workbook.close()
三,用openpyxl向Excel插入一行或一列
功能非常强大,文档主页点这里
- 插入列用insert_cols
- 插入行用insert_rows
读并加一列示例:
import openpyxl
wb = openpyxl.load_workbook('0.xlsx')
ws = wb.worksheets[0]
# 在第3列之前插入数据,这里序号是从1开始的
ws.insert_cols(3)
# 插入数据
for index, row in enumerate(ws.rows):#按行读取
if index == 0:
row[2].value = '新字段'
else:
row[2].value = index
wb.save('0_new.xlsx')
写示例:
import openpyxl
wb = openpyxl.Workbook()#创建一个表
sheet = wb.active#找到活动sheet页,
sheet.title = 'New Sheet'
sheet['C3'] = 'hello world'#这里读取是一样的,按cell读
for i in range(10):
sheet["A%d" % (i+1)].value = i + 1
sheet["E1"].value = "=SUM(A:A)"#还可以写公式
wb.save('新的excel.xlsx')