zoukankan      html  css  js  c++  java
  • python死磕四之文件与IO

      利用python进行文件操作在我们平常项目中也经常用到,下面是我日常工作中忽略或者没有遇到过的集中情况。

      

      一、你想将 print() 函数的输出重定向到一个文件中去。

      在 print() 函数中指定 file 关键字参数,像下面这样:

    with open('d:/work/test.txt', 'wt') as f:       # 这里的t是windows文件text的特有形式,会识别出换行符
        print('Hello World!', file=f)

      注意:关于输出重定向到文件中就这些了。但是有一点要注意的就是文件必须是以文本模式打开。 如果文件是二进制模式的话,打印就会出错。

      二、在读取二进制数据的时候,字节字符串和文本字符串的语义差异。

      注意:在读取二进制文件中,索引和迭代动作返回的是字节的值而不是字节字符串。

    >>> # Text string
    >>> t = 'Hello World'
    >>> t[0]
    'H'
    >>> for c in t:
    ...     print(c)
    ...
    H
    e
    l
    l
    o
    ...
    >>> # Byte string
    >>> b = b'Hello World'
    >>> b[0]
    72
    >>> for c in b:
    ...     print(c)
    ...
    72
    101
    108
    108
    111
    ...
    >>>

      如果你想从二进制模式的文件中读取或写入文本数据,必须确保要进行解码和编码操作。

    with open('somefile.bin', 'rb') as f:
        data = f.read(16)
        text = data.decode('utf-8')
    
    with open('somefile.bin', 'wb') as f:
        text = 'Hello World'
        f.write(text.encode('utf-8'))

      三、你想像一个文件中写入数据,但是前提必须是这个文件在文件系统上不存在。 也就是不允许覆盖已存在的文件内容。

      之前思路:用os模块判断这个文件名是否存在,再做读写操作。

      遗漏点:可以在 open() 函数中使用 x 模式来代替 w 模式的方法来解决这个问题。

    >>> with open('somefile', 'wt') as f:
    ...     f.write('Hello
    ')
    ...
    >>> with open('somefile', 'xt') as f:
    ...     f.write('Hello
    ')
    ...
    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    FileExistsEr

      四、你想使用操作类文件对象的程序来操作文本或二进制字符串。

    import io
    s = io.StringIO()   # 实例化一个对象存在内存中   
    s.write('hello world
    ')  # 给对象写操作
    print('this is a test',file=s)
    res = s.getvalue()
    print(res)

      io.StringIO 只能用于文本。如果你要操作二进制数据,要使用 io.BytesIO 类来代替。比如:

    >>> s = io.BytesIO()
    >>> s.write(b'binary data')
    >>> s.getvalue()

      当你想模拟一个普通的文件的时候 StringIO 和 BytesIO 类是很有用的。 比如,在单元测试中,你可以使用 StringIO 来创建一个包含测试数据的类文件对象, 这个对象可以被传给某个参数为普通文件对象的函数。

      五、你想读写一个gzip或bz2格式的压缩文件。

    import gzip
    with gzip.open('somefile.gz', 'rt') as f:
        text = f.read()
    
    # bz2 compression
    import bz2
    with bz2.open('somefile.bz2', 'rt') as f:
        text = f.read()
    # gzip compression
    import gzip
    with gzip.open('somefile.gz', 'wt') as f:
        f.write(text)
    
    # bz2 compression
    import bz2
    with bz2.open('somefile.bz2', 'wt') as f:
        f.write(text)

      六、总结os模块常用方法

    1.os.path.dirname(path) # 获得目录名
    2.os.path.join(path,filename) #可以拼接目录名
    3.os.path.splitext(path)  # 得到文件路径和格式名
    4.os.path.exists('/tmp/spam') # 判断文件是否存在
    5.os.path.isfile(path) # 判断是否是文件
    6.os.path.isdir(path)  # 判断是否是目录
    7.os.path.getsize(path) # 获得文件大小
    8.os.path.getmtime(path) # 获得文件修改时间
    9.os.listdir(path) # 获得目录下所有文件

    使用例子:使用 os.listdir() 函数来获取某个目录中的文件列表:

    import os.path
    
    # Get all regular files
    names = [name for name in os.listdir('somedir')
            if os.path.isfile(os.path.join('somedir', name))]
    
    # Get all dirs
    dirnames = [name for name in os.listdir('somedir')
            if os.path.isdir(os.path.join('somedir', name))]

      七、你需要在程序执行时创建一个临时文件或目录,并希望使用完之后可以自动销毁掉。

      tempfile 模块中有很多的函数可以完成这任务。 为了创建一个匿名的临时文件,可以使用 tempfile.TemporaryFile :

    from tempfile import TemporaryFile
    
    with TemporaryFile('w+t') as f:
        # Read/write to the file
        f.write('Hello World
    ')
        f.write('Testing
    ')
    
        # Seek back to beginning and read the data
        f.seek(0)
        data = f.read()

      TemporaryFile() 的第一个参数是文件模式,通常来讲文本模式使用 w+t ,二进制模式使用 w+b。 这个模式同时支持读和写操作,在这里是很有用的,因为当你关闭文件去改变模式的时候,文件实际上已经不存在了。 TemporaryFile() 另外还支持跟内置的 open() 函数一样的参数。

    with TemporaryFile('w+t', encoding='utf-8', errors='ignore') as f:
  • 相关阅读:
    paramiko 简单的使用
    python+appium 实现qq聊天的消息,滑动删除聊天消息
    selenium select 选择下拉框
    从FTP获取文件并恢复网络设备
    weblogic监控
    打包压缩maven库
    解决vsftp无法上传文件及文件夹的问题
    Ansible之Playbook详解、案例
    python解压分析jar包
    owasp对项目依赖的jar包安全扫描
  • 原文地址:https://www.cnblogs.com/jimmyhe/p/10807759.html
Copyright © 2011-2022 走看看