zoukankan      html  css  js  c++  java
  • 【Fine学习笔记】python 文件l操作方法整理

    python脚本可以对excel进行创建、读、写、保存成指定文件名,保存到指定路径的操作。整理了以下处理方法:
     
    首先区别几个操作方式:
    "r" 以读方式打开,只能读文件 , 如果文件不存在,会发生异常
    "w" 以写方式打开,只能写文件, 如果文件不存在,创建该文件,如果文件已存在,先清空,再打开文件
     
    "rb" 以二进制读方式打开,只能读文件 , 如果文件不存在,会发生异常
    "wb" 以二进制写方式打开,只能写文件, 如果文件不存在,创建该文件,如果文件已存在,先清空,再打开文件
     
    "rt" 以文本读方式打开,只能读文件 , 如果文件不存在,会发生异常
    "wt" 以文本写方式打开,只能写文件, 如果文件不存在,创建该文件,如果文件已存在,先清空,再打开文件
     
    "rb+" 以二进制读方式打开,可以读、写文件 , 如果文件不存在,会发生异常
    "wb+" 以二进制写方式打开,可以读、写文件, 如果文件不存在,创建该文件,如果文件已存在,先清空,再打开文件
     
    ***************************************************************************************
     
    ※对excel文件的操作(excel相关的类库:xlwt,xlrd)

    主要有三种方法:

    1> xlrd, xlwt, xlutils: 这三个库的好处是不需要其它支持,在任何操作系统上都可以使用。xlrd 可以读取 .xls, .xlsx 文件,非常好用;但因为 xlwt 不能直接修改 Excel 文档,必须得复制一份然后另存为其它文件,而且据说写复杂格式的 Excel 文件会出现问题。

    2> openpyxl: 这个库也是不需要其它支持的,而且据说对 Office 2007 格式支持得更好。加载 Excel 文件的效率比 xlrd 慢 3 倍以上,内存使用在 10 倍以上。

    3> win32com: Python Win32 扩展,这个库需要运行环境为 Windows+Office 对应版本。由于 Python Win32 扩展只是把 COM 接口包装了一下,可以视为与 VBA 完全相同,不会有读写格式上的问题。 win32com 读取 Excel 文件,效率还是比 xlrd 慢些。

    新建一个excel文件

    file = xlwt.Workbook() #注意这里的Workbook首字母是大写

    新建一个sheet

    table = file.add_sheet('sheet name')

    写入数据table.write(行,列,value)

    table.write(0,0,'test')

    注意:如果对一个单元格重复操作,会引发

             returns error:# Exception: Attempt to overwrite cell:# sheetname=u'sheet 1' rowx=0 colx=0

    解决办法:所以在打开时加cell_overwrite_ok=True

       table = file.add_sheet('sheet name',cell_overwrite_ok=True )

    保存文件

    file.save('demo.xls')

    使用style可以修改样式

    style = xlwt.XFStyle() # 初始化样式

    font = xlwt.Font() #为样式创建字体

    font.name = 'Times New Roman'

    font.bold = True

    style.font = font #为样式设置字体

    table.write(0, 0, 'some bold Times text', style) # 使用样式

    xlwt 允许单元格或者整行地设置格式。还可以添加链接以及公式。

    dates.py, 展示如何设置不同的数据格式

    hyperlinks.py, 展示如何创建超链接 

    merged.py, 展示如何合并格子

    row_styles.py, 展示如何应用Style到整行格子中.

    ================================================================
    对txt文件的操作
     
    ※读文件
    读文本文件
    input = open('data', 'r')
    #第二个参数默认为r
    input = open('data')
     
    读二进制文件
    input = open('data', 'rb')
     
    读取所有内容
    file_object = open('thefile.txt')
    try:
    all_the_text = file_object.read( )
    finally:
    file_object.close( )
     
    读固定字节
    file_object = open('abinfile', 'rb')
    try:
    while True:
    chunk = file_object.read(100)
    if not chunk:
    break
    do_something_with(chunk)
    finally:
    file_object.close( )
     
    读每行
    list_of_all_the_lines = file_object.readlines( )
     
    如果文件是文本文件,还可以直接遍历文件对象获取每行:
    for line in file_object:
    process line
     
    ================================================================
     
     ※写文件
    写文本文件
    output = open('data', 'w')
     
    写二进制文件
    output = open('data', 'wb')
     
    追加写文件
    output = open('data', 'w+')
     
    写数据并保存
    file_object = open('thefile.txt', 'w')
    file_object.write(all_the_text)
    file_object.close( )
     
    写入多行
    file_object.writelines(list_of_text_strings)
     
    ======================================================================
     
    代码示例:
     
    f = open(filename,'w') #打开文件open()是file()的别名
    f.write(context) #把字符串写入文件
    f.close() #关闭文件
     
    !writelines()和write()都能解决一次性写入的问题,区别在于性能,writelines()性能高于write()。
     
    #通过循环访问readlines()返回列表中的元素
    f = open(filename)
    try:
    lines = f.readlines()
    for line in lines:
    print line,
    finally:
    f.close()
     
    从文件中读取所有内容,将内容赋值到content
    f = open(filename)
    try:
    content = f.read()
    finally:
    f.close()
    print content
     
     
    # 最简单的例子
    import xlwt
    workbook = xlwt.Workbook(encoding = 'ascii')
    worksheet = workbook.add_sheet('My Worksheet')
    worksheet.write(0, 0, label = 'Row 0, Column 0 Value')
    workbook.save('Excel_Workbook.xls')
     
    # 格式化cell的font
    font = xlwt.Font() # Create the Font
    font.name = 'Times New Roman'
    font.bold = True
    font.underline = True
    font.italic = True
    style = xlwt.XFStyle() # Create the Style
    style.font = font # Apply the Font to the Style
    worksheet.write(0, 0, label = 'Unformatted value')
    worksheet.write(1, 0, label = 'Formatted value', style) # Apply the Style to the Cell
     
     
    # Font对象的属性
    font.bold = True # May be: True, False
    font.italic = True # May be: True, False
    font.struck_out = True # May be: True, False
    font.underline = xlwt.Font.UNDERLINE_SINGLE # May be: UNDERLINE_NONE, UNDERLINE_SINGLE, UNDERLINE_SINGLE_ACC, UNDERLINE_DOUBLE, UNDERLINE_DOUBLE_ACC
    font.escapement = xlwt.Font.ESCAPEMENT_SUPERSCRIPT # May be: ESCAPEMENT_NONE, ESCAPEMENT_SUPERSCRIPT, ESCAPEMENT_SUBSCRIPT
    font.family = xlwt.Font.FAMILY_ROMAN # May be: FAMILY_NONE, FAMILY_ROMAN, FAMILY_SWISS, FAMILY_MODERN, FAMILY_SCRIPT, FAMILY_DECORATIVE
    font.charset = xlwt.Font.CHARSET_ANSI_LATIN # May be: CHARSET_ANSI_LATIN, CHARSET_SYS_DEFAULT, CHARSET_SYMBOL, CHARSET_APPLE_ROMAN, CHARSET_ANSI_JAP_SHIFT_JIS, CHARSET_ANSI_KOR_HANGUL, CHARSET_ANSI_KOR_JOHAB, CHARSET_ANSI_CHINESE_GBK, CHARSET_ANSI_CHINESE_BIG5, CHARSET_ANSI_GREEK, CHARSET_ANSI_TURKISH, CHARSET_ANSI_VIETNAMESE, CHARSET_ANSI_HEBREW, CHARSET_ANSI_ARABIC, CHARSET_ANSI_BALTIC, CHARSET_ANSI_CYRILLIC, CHARSET_ANSI_THAI, CHARSET_ANSI_LATIN_II, CHARSET_OEM_LATIN_I
    font.colour_index = 2 # 0:black, 1: white, 2: red, 3:light green, 4:blue
    font.get_biff_record = ?
    font.height = 0x00C8 # C8 in Hex (in decimal) = 10 points in height.
    font.name = ?
    font.outline = ?
    font.shadow = ?
     
     
    # 设置cell的宽度
    worksheet.write(0, 0, 'My Cell Contents')
    worksheet.col(0).width = 3333 # 3333 = 1" (one inch).
     
    # 向cell添加一个日期
    style = xlwt.XFStyle()
    style.num_format_str = 'M/D/YY' # Other options: D-MMM-YY, D-MMM, MMM-YY, h:mm, h:mm:ss, h:mm, h:mm:ss, M/D/YY h:mm, mm:ss, [h]:mm:ss, mm:ss.0
    worksheet.write(0, 0, datetime.datetime.now(), style)
     
    # 向cell添加一个Formula
    worksheet.write(0, 0, 5) # Outputs 5
    worksheet.write(0, 1, 2) # Outputs 2
    worksheet.write(1, 0, xlwt.Formula('A1*B1')) # Should output "10" (A1[5] * A2[2])
    worksheet.write(1, 1, xlwt.Formula('SUM(A1,B1)')) # Should output "7" (A1[5] + A2[2])
     
    # 向cell添加一个Hyperlink
    worksheet.write(0, 0, xlwt.Formula('HYPERLINK("http://www.google.com";"Google")')) # Outputs the text "Google" linking to http://www.google.com
     
    # 合并行列
    worksheet.write_merge(0, 0, 0, 3, 'First Merge') # Merges row 0's columns 0 through 3.
    font = xlwt.Font() # Create Font
    font.bold = True # Set font to Bold
    style = xlwt.XFStyle() # Create Style
    style.font = font # Add Bold Font to Style
    worksheet.write_merge(1, 2, 0, 3, 'Second Merge', style) # Merges row 1 through 2's columns 0 through 3.
     
    # 设置cell内部定位
    alignment = xlwt.Alignment() # Create Alignment
    alignment.horz = xlwt.Alignment.HORZ_CENTER # May be: HORZ_GENERAL, HORZ_LEFT, HORZ_CENTER, HORZ_RIGHT, HORZ_FILLED, HORZ_JUSTIFIED, HORZ_CENTER_ACROSS_SEL, HORZ_DISTRIBUTED
    alignment.vert = xlwt.Alignment.VERT_CENTER # May be: VERT_TOP, VERT_CENTER, VERT_BOTTOM, VERT_JUSTIFIED, VERT_DISTRIBUTED
    style = xlwt.XFStyle() # Create Style
    style.alignment = alignment # Add Alignment to Style
    worksheet.write(0, 0, 'Cell Contents', style)
     
    # 添加cell的边框
    # Please note: While I was able to find these constants within the source code, on my system (using LibreOffice,) I was only presented with a solid line, varying from thin to thick; no dotted or dashed lines.
    borders = xlwt.Borders() # Create Borders
    borders.left = xlwt.Borders.DASHED # May be: NO_LINE, THIN, MEDIUM, DASHED, DOTTED, THICK, DOUBLE, HAIR, MEDIUM_DASHED, THIN_DASH_DOTTED, MEDIUM_DASH_DOTTED, THIN_DASH_DOT_DOTTED, MEDIUM_DASH_DOT_DOTTED, SLANTED_MEDIUM_DASH_DOTTED, or 0x00 through 0x0D.
    borders.right = xlwt.Borders.DASHED
    borders.top = xlwt.Borders.DASHED
    borders.bottom = xlwt.Borders.DASHED
    borders.left_colour = 0x40
    borders.right_colour = 0x40
    borders.top_colour = 0x40
    borders.bottom_colour = 0x40
    style = xlwt.XFStyle() # Create Style
    style.borders = borders # Add Borders to Style
    worksheet.write(0, 0, 'Cell Contents', style)
     
    # 设置cell的背景颜色
    pattern = xlwt.Pattern() # Create the Pattern
    pattern.pattern = xlwt.Pattern.SOLID_PATTERN # May be: NO_PATTERN, SOLID_PATTERN, or 0x00 through 0x12
    pattern.pattern_fore_colour = 5 # May be: 8 through 63. 0 = Black, 1 = White, 2 = Red, 3 = Green, 4 = Blue, 5 = Yellow, 6 = Magenta, 7 = Cyan, 16 = Maroon, 17 = Dark Green, 18 = Dark Blue, 19 = Dark Yellow , almost brown), 20 = Dark Magenta, 21 = Teal, 22 = Light Gray, 23 = Dark Gray, the list goes on...
    style = xlwt.XFStyle() # Create the Pattern
    style.pattern = pattern # Add Pattern to Style
    worksheet.write(0, 0, 'Cell Contents', style)
     
     
             
    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
  • 相关阅读:
    scrapy 模块功能流程--转
    CP三次握手和四次分手--转
    获取免费IP--代码--转
    爬虫介绍+Jupyter Notebook--转
    In Ubuntu, How to install Chinese Pinyin with Fcitx?
    对json文件进行简单读写操作
    ubuntu 中wget (下载)命令用法
    如何更改Ubuntu 16.04 默认Python版本方法
    如何将本地文件上传通过命令行命令上传到远程服务器上
    Ubuntu上,如何成功的安装pygrib
  • 原文地址:https://www.cnblogs.com/Fine-Chan/p/6306876.html
Copyright © 2011-2022 走看看