zoukankan      html  css  js  c++  java
  • 文件处理的打开方式、操作方法、指针的移动、修改方法

    一、文件处理的打开模式

    控制文件读写操作的模式:

    文件句柄 = open('文件路径', '模式')
    

    1. 打开文件的模式有(默认为文本模式):

    r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
    w,只写模式【不可读;不存在则创建;存在则清空内容】
    a, 之追加写模式【不可读;不存在则创建;存在则只追加内容】

    2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式)

    rb
    wb
    ab
    注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码

    3. 了解部分

    "+" 表示可以同时读写某个文件
    r+, 读写【可读,可写】
    w+,写读【可读,可写】
    a+, 写读【可读,可写】

    x, 只写模式【不可读;不存在则创建,存在则报错】
    x+ ,写读【可读,可写】
    xb

    二、操作文件的方法:

    掌握

    f.read() #读取所有内容,光标移动到文件末尾
    f.readline() #读取一行内容,光标移动到第二行首部
    f.readlines() #读取每一行内容,存放于列表中

    f.write('1111 222 ') #针对文本模式的写,需要自己写换行符
    f.write('1111 222 '.encode('utf-8')) #针对b模式的写,需要自己写换行符
    f.writelines(['333 ','444 ']) #文件模式
    f.writelines([bytes('333 ',encoding='utf-8'),'444 '.encode('utf-8')]) #b模式

    了解

    f.readable() #文件是否可读
    f.writable() #文件是否可读
    f.closed #文件是否关闭
    f.encoding #如果文件打开模式为b,则没有该属性
    f.flush() #立刻将文件内容从内存刷到硬盘
    f.name

    三、文件内光标移动

    1、read(3):

      1). 文件打开方式为文本模式时,代表读取3个字符

      2). 文件打开方式为b模式时,代表读取3个字节

    2、 其余的文件内光标移动都是以字节为单位如seek,tell,truncate

    注意:

    1).seek有三种移动方式0,1,2,其中1和2必须在b模式下进行,但无论哪种模式,都是以bytes为单位移动的

    主动控制指针移动
    f.seek(移动的字节个数,模式)
    模式有三种:
    0: 永远参照文件开头
    1:参照当前所在的位置#
    2:永远参照文件末尾
    

      注意:只有0模式可以在t下使用,1和2只能在b模式下使用

    with open('a.txt',mode='rt',encoding='utf-8') as f:
    f.seek(3,0)
    f.seek(5,0)
    print(f.tell())
    
    with open('a.txt',mode='rb') as f:
    f.seek(3,1)
    f.seek(5,1)
    print(f.tell())
    res=f.read()
    print(res.decode('utf-8'))
    
    with open('a.txt',mode='rb') as f:    
    f.seek(-3,2)    
    print(f.tell())    
    f.seek(0,2)
    

    2).truncate是截断文件,所以文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate要在r+或a或a+等模式下测试效果

    案例:
    import time
    with open('test.txt','rb') as f:
        f.seek(0,2)
        while True:
            line=f.readline()
            if line:
                print(line.decode('utf-8'))
            else:
                time.sleep(0.2)
    

    四、文件的修改

    修改文件的方式一:

    1、先将文件内容全部读入内存

    2、在内存中完成修改

    3、将修改后的内容覆盖回原文件

    import os
    
    with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
        data=read_f.read() #全部读入内存,如果文件很大,会很卡
        data=data.replace('alex','SB') #在内存中完成修改
    
        write_f.write(data) #一次性写入新文件
    
    os.remove('a.txt')
    os.rename('.a.txt.swap','a.txt') 
    

    p s: 耗费内存不耗费硬盘~~~

    修改文件的方式二:

    1、以读的方式打开原文件,然后以写的方式打开一个临时文件

    2、读原文件的一行内容到内存,然后在内存中修改完毕后再写入临时文件,循环往复直到全部改完

    3、删出原文件,将临时文件重命名为原文件名

    import os
    
     with open('e.txt',mode='rt',encoding='utf-8') as src_f,open('.e.txt.swp',mode='wt',encoding='utf-8') as dst_f:
         for line in src_f:
             dst_f.write(line.replace('EGON','egon'))
    
     os.remove('e.txt')
     os.rename('.e.txt.swp','e.txt')
    

    p s: 耗费硬盘不耗费内存

    ==建议使用方式二

  • 相关阅读:
    bzoj 4566: [Haoi2016]找相同字符
    杜教筛模板
    bzoj 3772 :精神污染 线段树+打标记 or 主席树
    bzoj 3779: 重组病毒
    bzoj 3357: [Usaco2004]等差数列
    bzoj 3551: [ONTAK2010]Peaks加强版
    bzoj 4358: permu 莫队
    线段树分裂合并
    bzoj 3065 带插入区间k小值
    子串 [NOIP2015]
  • 原文地址:https://www.cnblogs.com/caodan01/p/14190604.html
Copyright © 2011-2022 走看看