zoukankan      html  css  js  c++  java
  • python 文件操作

    open() 方法

    Python open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError。

    注意:使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法。使用 with 上下文则可避免出现异常时, 文件没有正常关闭引起的问题.

    open() 方法的完整声明如下: 

    open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True)

    参数说明:

    • file: 文件路径 (相对或者绝对路径)
    • mode: 可选,文件模式 (见下文)
    • buffering: 设置缓冲, 其中: 0 表示没有缓冲, 1 表示进行了行缓冲, 而负值要求采用系统默认设置.
    • encoding: 文件编码格式, 如 utf-8, 或 ascii
    • errors: 报错级别, 默认为 "strict", 详细描述见下文
    • newline: 控制通用的捣行符模式行为, 可以设置为None, "", " ", " ", " ". 如果设置为 None, " ", " ", " " 都会被转换为 " "; 如果设置 ""(空字符串), 所有这些行结束形式都会被识别为换行符, 但在文本中不会转换. 如果设置为了任何有效值, 该值将用于结束各行.
    • closefd: 控制在调用 close 方法时, 是否实际关闭底层文件描述符, 默认情况下为 True.

     

    文件模式

    默认为文本模式,如果要以二进制模式打开,加上 b.

    t    文本模式 (默认)。
    x    写模式,新建一个文件,如果该文件已存在则会报错。
    b    二进制模式。
    +    打开一个文件进行更新(可读可写)。
    U    通用换行模式(不推荐)。
    r    以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
    rb    以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
    r+    打开一个文件用于读写。文件指针将会放在文件的开头。
    rb+    以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
    w    打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
    wb    以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
    w+    打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
    wb+    以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
    a    打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
    ab    以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
    a+    打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
    ab+    以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

    报错级别

    转换字符串值时, 如果遇到无法转换的字符, 将会遇到编码错误, 例如尝试将一个字符足编码为 ascii, 而其中含有值超出 0-127 的字符, 会由于其值太大而无法使用 ASCII 字符集表示. 

    不同的报错级别, 给予文件打开时不同的处理策略.

    "strict"   遇到编码和解码错误时, 引发异常(UnicodeError)

    "ignore"  忽略无效字符

    "replace"  将无效字符替换为一个替换字符 (Unicode中的U+FFFD, 标准字符串中的 "?")

    "backslashreplace"  将无效的字符替换为 Python 字符转义序列, 如字符 U+1234 替换为 "u1234"

    "xmlcharrefreplace"  将无效的字符替换为 XML 字符引用, 如字符 U+1234 替换为 "ሴ"

    常用方法

    close()
    关闭文件。关闭后文件不能再进行读写操作。

    flush()
    刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。

    fileno()
    返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。

    isatty()
    如果文件连接到一个终端设备返回 True,否则返回 False。

    next()
    返回文件下一行。

    read([size])
    从文件读取指定的字节数,如果未给定或为负则读取所有。

    readline([size])
    读取整行,包括 " " 字符。

    readlines([sizeint])
    读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。

    seek(offset[, whence])
    设置文件当前位置

    tell()
    返回文件当前位置。

    truncate([size])
    从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。

    write(str)
    将字符串写入文件,返回的是写入的字符长度。

    writelines(sequence)
    向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。

  • 相关阅读:
    网络营销高人的八点心得/搜索引擎推广方法
    先富者的生活方式,必须注重质量
    知识素养
    成功创业的20条法则, 成为行业中世界顶尖
    ]梦想因人的追逐而变的伟大!
    职场做人既要对事也要对人
    宽恕:管理人的最佳武器
    别了,2006
    让你在职场游刃有余的10句话
    开发客户的十大传世技巧
  • 原文地址:https://www.cnblogs.com/diysoul/p/10633278.html
Copyright © 2011-2022 走看看