zoukankan      html  css  js  c++  java
  • x模式&b模式&文件操作

    x模式(控制文件操作的模式)-》了解
    x, 只写模式【不可读;不存在则创建,存在则报错】
    

    """
    with open('a.txt',mode='x',encoding='utf-8') as f:
    pass

     with open('c.txt',mode='x',encoding='utf-8') as f:
         f.read()
    

    with open('d.txt', mode='x', encoding='utf-8') as f:
    f.write('哈哈哈 ')

    控制文件读写内容的模式
    t:
    1、读写都是以字符串(unicode)为单位
    2、只能针对文本文件
    3、必须指定字符编码,即必须指定encoding参数
    b:binary模式
    1、读写都是以bytes为单位
    2、可以针对所有文件
    3、一定不能指定字符编码,即一定不能指定encoding参数

    总结:
    1、在操作纯文本文件方面t模式帮我们省去了编码与解码的环节,b模式则需要手动编码与解码,所以此时t模式更为方便
    2、针对非文本文件(如图片、视频、音频等)只能使用b模式
    """

     错误演示:t模式只能读文本文件
     with open(r'爱nmlgb的爱情.mp4',mode='rt') as f:
         f.read() ##### 硬盘的二进制读入内存-》t模式会将读入内存的内容进行decode解码操作
    
    
    
     with open(r'test.jpg',mode='rb',encoding='utf-8') as f:
         res=f.read() ##### 硬盘的二进制读入内存—>b模式下,不做任何转换,直接读入内存
         print(res) ##### bytes类型—》当成二进制
         print(type(res))
    
     with open(r'd.txt',mode='rb') as f:
         res=f.read() ##### utf-8的二进制
         print(res,type(res))
    
         print(res.decode('utf-8'))
    
     with open(r'd.txt',mode='rt',encoding='utf-8') as f:
         res=f.read() ##### utf-8的二进制->unicode
         print(res)
    
    
     with open(r'e.txt',mode='wb') as f:
         f.write('你好hello'.encode('gbk'))
    
     with open(r'f.txt',mode='wb') as f:
         f.write('你好hello'.encode('utf-8'))
         f.write('哈哈哈'.encode('gbk'))
    
    
     文件拷贝工具
    src_file=input('源文件路径>>: ').strip()
    dst_file=input('源文件路径>>: ').strip()
    with open(r'{}'.format(src_file),mode='rb') as f1,
    open(r'{}'.format(dst_file),mode='wb') as f2:
    ##### res=f1.read() ##### 内存占用过大
    ##### f2.write(res)
    
    for line in f1:
        f2.write(line)
    
    循环读取文件
    方式一:自己控制每次读取的数据的数据量
     with open(r'test.jpg',mode='rb') as f:
         while True:
             res=f.read(1024) ##### 1024
             if len(res) == 0:
                 break
             print(len(res))
    
    方式二:以行为单位读,当一行内容过长时会导致一次性读入内容的数据量过大
     with open(r'g.txt',mode='rt',encoding='utf-8') as f:
         for line in f:
             print(len(line),line)
    
     with open(r'g.txt',mode='rb') as f:
         for line in f:
             print(line)
    
     with open(r'test.jpg',mode='rb') as f:
         for line in f:
             print(line)
    
    一:读相关操作
    1、readline:一次读一行
    with open(r'g.txt',mode='rt',encoding='utf-8') as f:
        ##### res1=f.readline()
        ##### res2=f.readline()
        ##### print(res2)
    
        while True:
            line=f.readline()
            if len(line) == 0:
                break
            print(line)
    
    2、readlines:
    with open(r'g.txt',mode='rt',encoding='utf-8') as f:
        res=f.readlines()
        print(res)
    
    强调:
    f.read()与f.readlines()都是将内容一次性读入内存,如果内容过大会导致内存溢出,若还想将内容全读入内存,
    二:写相关操作
     f.writelines():
     with open('h.txt',mode='wt',encoding='utf-8') as f:
         ##### f.write('1111
    222
    3333
    ')
    
         ##### l=['11111
    ','2222','3333',4444]
         l=['11111
    ','2222','3333']
         ##### for line in l:
         #####     f.write(line)
         f.writelines(l)
    
    
     with open('h.txt', mode='wb') as f:
         ##### l = [
         #####     '1111aaa1
    '.encode('utf-8'),
         #####     '222bb2'.encode('utf-8'),
         #####     '33eee33'.encode('utf-8')
         ##### ]
    
    补充1:如果是纯英文字符,可以直接加前缀b得到bytes类型
         ##### l = [
         #####     b'1111aaa1
    ',
         #####     b'222bb2',
         #####     b'33eee33'
         ##### ]
    
    补充2:'上'.encode('utf-8') 等同于bytes('上',encoding='utf-8')
         l = [
             bytes('上啊',encoding='utf-8'),
             bytes('冲呀',encoding='utf-8'),
             bytes('小垃圾们',encoding='utf-8'),
         ]
         f.writelines(l)
    
    
     3、flush:
     with open('h.txt', mode='wt',encoding='utf-8') as f:
         f.write('哈')
         ##### f.flush()
    
    4、了解
    with open('h.txt', mode='wt', encoding='utf-8') as f:
    print(f.readable())
    print(f.writable())
    print(f.encoding)
    print(f.name)
    
    print(f.closed)
    
    
    
     指针移动的单位都是以bytes/字节为单位
     只有一种情况特殊:
           t模式下的read(n),n代表的是字符个数
    
     with open('aaa.txt',mode='rt',encoding='utf-8') as f:
         res=f.read(4)
         print(res)
    
    f.seek(n,模式):n指的是移动的字节个数
    模式:
    模式0:参照物是文件开头位置
     f.seek(9,0)
     f.seek(3,0) ##### 3
    
    模式1:参照物是当前指针所在位置
     f.seek(9,1)
     f.seek(3,1) ##### 12
    
    模式2:参照物是文件末尾位置,应该倒着移动
     f.seek(-9,2) ##### 3
     f.seek(-3,2) ##### 9
    
    强调:只有0模式可以在t下使用,1、2必须在b模式下用
     f.tell() ##### 获取文件指针当前位置
    
    示范
     with open('aaa.txt',mode='rb') as f:
         f.seek(9,0)
         f.seek(3,0) ##### 3
         ##### print(f.tell())
         f.seek(4,0)
         res=f.read()
         print(res.decode('utf-8'))
    
    
    
     with open('aaa.txt',mode='rb') as f:
         f.seek(9,1)
         f.seek(3,1) ##### 12
         print(f.tell())
    
    
     with open('aaa.txt',mode='rb') as f:
         f.seek(-9,2)
         ##### print(f.tell())
         f.seek(-3,2)
         ##### print(f.tell())
         print(f.read().decode('utf-8'))
    
    1、通用文件copy工具实现
    
    2、基于seek控制指针移动,测试r+、w+、a+模式下的读写内容
    
    3、tail -f access.log程序实现
  • 相关阅读:
    【Foreign】数数 [打表][DP]
    【Foreign】猜测 [费用流]
    【Foreign】最大割 [线性基]
    【Foreign】开锁 [概率DP]
    【Foreign】染色 [LCT][线段树]
    【Foreign】阅读 [线段树][DP]
    【Foreign】字符串匹配 [KMP]
    【Foreign】冒泡排序 [暴力]
    【BZOJ1976】能量魔方 [最小割]
    【Foreign】树 [prufer编码][DP]
  • 原文地址:https://www.cnblogs.com/abldh12/p/15208777.html
Copyright © 2011-2022 走看看