zoukankan      html  css  js  c++  java
  • 12、文件处理 b模式

    一、t模式与b模式的区别

    1.1、控制文件读写内容的模式

    1.1.1、t 模式

      (1)读写都是以字符串(unicode)为单位

      (2)读写只能针对文本

      (3)必须指定字符编码,即必须指定encoding参数

    1.1.2、b 参数

      (1)读写都是以二进制(bytes)为单位

      (2)可以针对任意类型文件

      (3)一定不能指定字符编码,即不能指定encoding参数

      (4)需要手动编码解码

    1.1.3、总结

      (1)在纯文本文件操作时,使用t模式可以帮我们省去编码和解码的过程,b模式则需要手动去编码和解码,所以此时t模式更加的方便。

      (2)针对非文本文件(图片,视频等)时,只能使用b模式进行操作,

    1.2、 b 模式下对文件一次性的读写

    1.2.1、读取文件  rb

    with open(r'd.txt',mode='rb') as f:
        res=f.read() # utf-8的二进制
        print(res,type(res))     #  读出二进制代码
        print(res.decode('utf-8'))     #  读出文件内容

    1.2.2、 写入文件 wb

    with open(r'f.txt',mode='wb') as f:
        f.write('你好hello'.encode('utf-8'))  #必须加入encode
        f.write('哈哈哈'.encode('gbk'))    #读取时只能以gbk模式或者utf-8读写

    1.2.3、文件拷贝工具  rb+wb

    src_file=input('源文件路径>>: ').strip()
    dst_file=input('源文件路径>>: ').strip()
    with open(r'{}'.format(src_file),mode='rb') as f1,
        open(r'{}'.format(dst_file),mode='wb') as f2:
        res=f1.read()     # 存在内存占用过大的可能
        f2.write(res)
    
        for line in f1:      #优化的方法
            f2.write(line)

    1.3、循环读取文件,分次读写

    1.3.1、以字节为单位,自己控制每次自己读取数据的数据量

    with open(r'test.jpg',mode='rb') as f:
        while True:
            res=f.read(1024) # 1024
            if len(res) == 0:
                break
            print(len(res))

    1.3.2、以每行为单位进行读写,但是也有可能出现一次性单行读出数据量过大

    1.3.2.1、w模式下for循环读文件

    with open(r'g.txt',mode='rt',encoding='utf-8') as f:
        for line in f:
            print(len(line),line)

    1.3.2.2、b模式下for循环读文件

    with open(r'g.txt',mode='rb') as f:
        for line in f:
            print(line)#文件内容均为字母或数字,否则需要加encode

    1.3.2.3、b模式下for循环读图片

    with open(r'test.jpg',mode='rb') as f:
        for line in f:
            print(line) #此内容为数字和字母形式,没有加encode

    二、文件操作的其他方法

    2.1、读相关操作

    2.1.1、w模式下while循环读文件,readline(一次只能读一行)

    with open(r'g.txt',mode='rt',encoding='utf-8') as f:
        res1=f.readline()
        res2=f.readline()
        print(res2)
    #使用while循环读取
        while True:
            line=f.readline()
            if len(line) == 0:
                break
            print(line)

    2.1.2、b模式下,一次性多行读写。存为列表形式。readlines

    with open(r'g.txt',mode='rt',encoding='utf-8') as f:
        res=f.readlines()
        print(res)

    2.1.3、read和readlines的区别

      read是按照文件内容直接读出,readlines是将文件内容以列表的形式读出

      注:read和readlines都是将文件内容一次性读入内存,如果内容过大,有可能会将内存溢出,可以使用for循环单行读入,或者read(n)限制一次性读写字节数。

    2.2、写相关操作

    2.2.1、一次性多行写入 writelines

    f.writelines():
    with open('h.txt',mode='wt',encoding='utf-8') as f:
    #使用write写入    
         f.write('1111
    222
    3333
    ')
    #使用for循环+write写入
        # l=['11111
    ','2222','3333',4444]
        l=['11111
    ','2222','3333']
         for line in l:
             f.write(line)
    #使用writelines写入
        f.writelines(l)

    2.2.2、b模式下文件的写入

    with open('h.txt', mode='wb') as f:
        l = [
            '1111aaa1
    '.encode('utf-8'),
            '222bb2'.encode('utf-8'),
            '33eee33'.encode('utf-8')
        ]
    
        # 补充1:如果是纯英文字符,可以直接加前缀b得到bytes类型
        l = [
            b'1111aaa1
    ',
            b'222bb2',
            b'33eee33'
        ]
    
        # 补充2:'上'.encode('utf-8') 等同于bytes('上',encoding='utf-8')
        l = [
            bytes('上啊',encoding='utf-8'),
            bytes('冲呀',encoding='utf-8'),
            bytes('小垃圾们',encoding='utf-8'),
        ]
        f.writelines(l)

    2.3、立即写入硬盘    flush

    with open('h.txt', mode='wt',encoding='utf-8') as f:
        f.write('')
        # f.flush()

    2.4、了解

    with open('../../../../Desktop/Python课堂笔记/day12笔记/h.txt', mode='wt', encoding='utf-8') as f:
        print(f.readable())      判断文件是否可读
        print(f.writable())    判断文件是否可写
        print(f.encoding)     格式,如‘utf-8,’如果文件打开属性为b,则没有该属性
        print(f.name)         输出绝对路径
    
    print(f.closed)      判断文件是否关闭

    三、控制文件的指针移动

    3.1、指针移动的单位都是以bytes/字节为单位的,但t模式下的read(n),n代表的是字符个数。

    with open('aaa.txt',mode='rt',encoding='utf-8') as f:
        res=f.read(4)
        print(res)    #输出前四个字节

    3.2、指针的移动  f.seek(a,b)

    3.2.1、模式0,即b=0,参照物是文件开头位置

    f.seek(9,0)
    f.seek(3,0) # 3

    with open('aaa.txt',mode='rb') as f:
    f.seek(9,0)
    f.seek(3,0) # 3
    # print(f.tell())
    f.seek(4,0)
    res=f.read()
    print(res.decode('utf-8'))

    3.2.2、模式1,即b=1,参照物是当前指针位置

    f.seek(9,1)
    f.seek(3,1) # 12

    with open('aaa.txt',mode='rb') as f:
    f.seek(9,1)
    f.seek(3,1) # 12
    print(f.tell())

    3.2.3、模式2,即b=2,参照物是文件结尾

    f.seek(-9,2) # 3
    f.seek(-3,2) # 9

    with open('aaa.txt',mode='rb') as f:
    f.seek(-9,2)
    # print(f.tell())
    f.seek(-3,2)
    # print(f.tell())
    print(f.read().decode('utf-8'))

    注意:0模式可以在t模式下使用,0和1以及2可以在b模式下使用

    3.2.4、当前指针位置 f.tell()

    f.tell() # 获取文件指针当前位置

     3.3、练习

      实现动态时刻更新日志的效果

    import time
    with open('acess.log',mode='rb')as f:
        f.seek(0,2)
        while 1:
            line = f.readline()
            if len(line) ==0:
                time.sleep(0.3)
            else:
                print(line.decode('utf-8'),end=)
  • 相关阅读:
    [ jquery 文档处理 replaceWith(content|fn) replaceAll(content) ] 此方法用于把所有匹配的元素替换成指定的HTML或DOM元素
    [ jquery 文档处理 wrapInner(htm|element|fnl) ] 此方法用于把所有匹配的元素的子元素(包括文本节点)使用指定的 HTML 元素来包裹
    [ jquery 文档处理 wrapAll(html|ele)) ] 此方法用于把所有匹配的元素使用指定的 HTML 元素来包裹
    [ jquery 文档处理 wrap(html|element|fn) ] 此方法用于把所有匹配的元素用其他元素的结构化标记包裹起来
    [ jquery 文档处理 insertBefore(content) before(content|fn) ] 此方法用于把所有匹配的元素插入到另一个、指定的元素元素集合的前面,实现外部插入
    [ jquery 文档处理 insertAfter(content) after(content|fn) ] 此方法用于把所有匹配的元素插入到另一个、指定的元素元素集合的后面,实现外部插入
    [ jquery 文档处理 prependTo(content) ] 此方法用于把所有匹配的元素前置到另一个、指定的元素元素集合中
    剑指 Offer 55
    剑指 Offer 54. 二叉搜索树的第k大节点 树的遍历
    剑指 Offer 52. 两个链表的第一个公共节点 哈希
  • 原文地址:https://www.cnblogs.com/jingpeng/p/12507120.html
Copyright © 2011-2022 走看看