zoukankan      html  css  js  c++  java
  • Python 官方文件

    7.2. 文件读写

    函数 open() 返回 文件对象,通常的用法需要两个参数:open(filename, mode)

    >>> f = open('workfile', 'w')
    

    第一个参数是一个含有文件名的字符串。第二个参数也是一个字符串,含有描述如何使用该文件的几个字符。mode 为 'r' 时表示只是读取文件;'w' 表示只是写入文件(已经存在的同名文件将被删掉);'a' 表示打开文件进行追加,写入到文件中的任何数据将自动添加到末尾。 'r+' 表示打开文件进行读取和写入。mode 参数是可选的,默认为 'r'

    通常,文件以 文本 打开,这意味着,你从文件读出和向文件写入的字符串会被特定的编码方式(默认是UTF-8)编码。模式后面的 'b' 以 二进制模式 打开文件:数据会以字节对象的形式读出和写入。这种模式应该用于所有不包含文本的文件。

    在文本模式下,读取时默认会将平台有关的行结束符(Unix上是   , Windows上是  )转换为  。在文本模式下写入时,默认会将出现的   转换成平台有关的行结束符。这种暗地里的修改对 ASCII 文本文件没有问题,但会损坏 JPEG 或 EXE 这样的二进制文件中的数据。使用二进制模式读写此类文件时要特别小心。

    7.2.1. 文件对象方法

    本节中的示例都默认文件对象 f 已经创建。

    要读取文件内容,需要调用 f.read(size),该方法读取若干数量的数据并以字符串形式返回其内容,size 是可选的数值,指定字符串长度。如果没有指定 size 或者指定为负数,就会读取并返回整个文件。当文件大小为当前机器内存两倍时,就会产生问题。反之,会尽可能按比较大的 size 读取和返回数据。如果到了文件末尾,f.read() 会返回一个空字符串(''):

    >>> f.read()
    'This is the entire file.
    '
    >>> f.read()
    ''
    

    f.readline() 从文件中读取单独一行,字符串结尾会自动加上一个换行符(   ),只有当文件最后一行没有以换行符结尾时,这一操作才会被忽略。这样返回值就不会有混淆,如果 f.readline()返回一个空字符串,那就表示到达了文件末尾,如果是一个空行,就会描述为 ' ',一个只包含换行符的字符串:

    >>> f.readline()
    'This is the first line of the file.
    '
    >>> f.readline()
    'Second line of the file
    '
    >>> f.readline()
    ''
    

    你可以循环遍历文件对象来读取文件中的每一行。这是一种内存高效、快速,并且代码简介的方式:

    >>> for line in f:
    ...     print(line, end='')
    ...
    This is the first line of the file.
    Second line of the file
    

    如果你想把文件中的所有行读到一个列表中,你也可以使用 list(f) 或者 f.readlines()

    f.write(string) 方法将 string 的内容写入文件,并返回写入字符的长度:

    >>> f.write('This is a test
    ')
    15
    

    想要写入其他非字符串内容,首先要将它转换为字符串:

    >>> value = ('the answer', 42)
    >>> s = str(value)
    >>> f.write(s)
    18
    

    f.tell() 返回一个整数,代表文件对象在文件中的指针位置,该数值计量了自文件开头到指针处的比特数。需要改变文件对象指针话话,使用 f.seek(offset,from_what)。指针在该操作中从指定的引用位置移动 offset 比特,引用位置由 from_what 参数指定。 from_what 值为 0 表示自文件起始处开始,1 表示自当前文件指针位置开始,2 表示自文件末尾开始。from_what 可以忽略,其默认值为零,此时从文件头开始:

    >>> f = open('workfile', 'rb+')
    >>> f.write(b'0123456789abcdef')
    16
    >>> f.seek(5)     # Go to the 6th byte in the file
    5
    >>> f.read(1)
    b'5'
    >>> f.seek(-3, 2) # Go to the 3rd byte before the end
    13
    >>> f.read(1)
    b'd'
    

    在文本文件中(没有以 b 模式打开),只允许从文件头开始寻找(有个例外是用 seek(0, 2) 寻找文件的最末尾处)而且合法的 偏移 值只能是 f.tell() 返回的值或者是零。其它任何 偏移 值都会产生未定义的行为。

    当你使用完一个文件时,调用 f.close() 方法就可以关闭它并释放其占用的所有系统资源。 在调用 f.close() 方法后,试图再次使用文件对象将会自动失败。

    >>> f.close()
    >>> f.read()
    Traceback (most recent call last):
      File "<stdin>", line 1, in ?
    ValueError: I/O operation on closed file
    

    用关键字 with 处理文件对象是个好习惯。它的先进之处在于文件用完后会自动关闭,就算发生异常也没关系。它是 try-finally 块的简写:

    >>> with open('workfile', 'r') as f:
    ...     read_data = f.read()
    >>> f.closed
    True
    

    文件对象还有一些不太常用的附加方法,比如 isatty() 和 truncate() 在库参考手册中有文件对象的完整指南。

    7.2.2. 使用 json 存储结构化数据

    从文件中读写字符串很容易。数值就要多费点儿周折,因为 read() 方法只会返回字符串,应将其传入 int() 这样的函数,就可以将 '123' 这样的字符串转换为对应的数值 123。当你想要保存更为复杂的数据类型,例如嵌套的列表和字典,手工解析和序列化它们将变得更复杂。

    好在用户不是非得自己编写和调试保存复杂数据类型的代码,Python 允许你使用常用的数据交换格式 JSON(JavaScript Object Notation)。标准模块 json 可以接受 Python 数据结构,并将它们转换为字符串表示形式;此过程称为 序列化。从字符串表示形式重新构建数据结构称为 反序列化。序列化和反序列化的过程中,表示该对象的字符串可以存储在文件或数据中,也可以通过网络连接传送给远程的机器。

    Note

    JSON 格式经常用于现代应用程序中进行数据交换。许多程序员都已经熟悉它了,使它成为相互协作的一个不错的选择。

    如果你有一个对象 x,你可以用简单的一行代码查看其 JSON 字符串表示形式:

    >>> json.dumps([1, 'simple', 'list'])
    '[1, "simple", "list"]'
    

    dumps() 函数的另外一个变体 dump(),直接将对象序列化到一个文件。所以如果 f 是为写入而打开的一个 文件对象,我们可以这样做:

    json.dump(x, f)
    

    为了重新解码对象,如果 f 是为读取而打开的 文件对象:

    x = json.load(f)
    

    这种简单的序列化技术可以处理列表和字典,但序列化任意类实例为 JSON 需要一点额外的努力。 json 模块的手册对此有详细的解释。

    See also

    pickle - pickle 模块

    与 JSON 不同,pickle 是一个协议,它允许任意复杂的 Python 对象的序列化。因此,它只能用于 Python 而不能用来与其他语言编写的应用程序进行通信。默认情况下它也是不安全的:如果数据由熟练的攻击者精心设计, 反序列化来自一个不受信任源的 pickle 数据可以执行任意代码。

  • 相关阅读:
    iOS 新浪微博-1.0框架搭建
    实体框架 Code First
    Autofac 依赖注入框架 使用
    Python3.4下使用sqlalchemy
    将做好的py文件打包成模块,供别人安装调用
    ORA-12541:TNS:no listener 客户端tnsnames.ora配置,以及服务端listener.ora配置
    ADO 连接数据库,取到VT_DATE型日期转换成 int型
    python中date、datetime、string的相互转换
    VC++6.0 Win32 C2065:SM_XVIRTUALSCREEN
    Navicat Premium连接Oracle 问题汇总
  • 原文地址:https://www.cnblogs.com/zqxqx/p/8088004.html
Copyright © 2011-2022 走看看