zoukankan html css js c++ java

12、文件处理 b模式

一、t模式与b模式的区别

1.1、控制文件读写内容的模式

1.1.1、t 模式

　　（1）读写都是以字符串（unicode）为单位

　　（2）读写只能针对文本

　　（3）必须指定字符编码，即必须指定encoding参数

1.1.2、b 参数

　　（1）读写都是以二进制（bytes）为单位

　　（2）可以针对任意类型文件

　　（3）一定不能指定字符编码，即不能指定encoding参数

　　（4）需要手动编码解码

1.1.3、总结

　　（1）在纯文本文件操作时，使用t模式可以帮我们省去编码和解码的过程，b模式则需要手动去编码和解码，所以此时t模式更加的方便。

　　（2）针对非文本文件（图片，视频等）时，只能使用b模式进行操作，

1.2、 b 模式下对文件一次性的读写

1.2.1、读取文件 rb

with open(r'd.txt',mode='rb') as f:
    res=f.read() # utf-8的二进制
    print(res,type(res))     #  读出二进制代码
    print(res.decode('utf-8'))     #  读出文件内容

1.2.2、写入文件 wb

with open(r'f.txt',mode='wb') as f:
    f.write('你好hello'.encode('utf-8'))  #必须加入encode
    f.write('哈哈哈'.encode('gbk'))    #读取时只能以gbk模式或者utf-8读写

1.2.3、文件拷贝工具 rb+wb

src_file=input('源文件路径>>: ').strip()
dst_file=input('源文件路径>>: ').strip()
with open(r'{}'.format(src_file),mode='rb') as f1,
    open(r'{}'.format(dst_file),mode='wb') as f2:
    res=f1.read()     # 存在内存占用过大的可能
    f2.write(res)

    for line in f1:      #优化的方法
        f2.write(line)

1.3、循环读取文件，分次读写

1.3.1、以字节为单位，自己控制每次自己读取数据的数据量

with open(r'test.jpg',mode='rb') as f:
    while True:
        res=f.read(1024) # 1024
        if len(res) == 0:
            break
        print(len(res))

1.3.2、以每行为单位进行读写，但是也有可能出现一次性单行读出数据量过大

1.3.2.1、w模式下for循环读文件

with open(r'g.txt',mode='rt',encoding='utf-8') as f:
    for line in f:
        print(len(line),line)

1.3.2.2、b模式下for循环读文件

with open(r'g.txt',mode='rb') as f:
    for line in f:
        print(line)#文件内容均为字母或数字，否则需要加encode

1.3.2.3、b模式下for循环读图片

with open(r'test.jpg',mode='rb') as f:
    for line in f:
        print(line) #此内容为数字和字母形式，没有加encode

二、文件操作的其他方法

2.1、读相关操作

2.1.1、w模式下while循环读文件，readline（一次只能读一行）

with open(r'g.txt',mode='rt',encoding='utf-8') as f:
    res1=f.readline()
    res2=f.readline()
    print(res2)
#使用while循环读取
    while True:
        line=f.readline()
        if len(line) == 0:
            break
        print(line)

2.1.2、b模式下，一次性多行读写。存为列表形式。readlines

with open(r'g.txt',mode='rt',encoding='utf-8') as f:
    res=f.readlines()
    print(res)

2.1.3、read和readlines的区别

　　read是按照文件内容直接读出，readlines是将文件内容以列表的形式读出

　　注：read和readlines都是将文件内容一次性读入内存，如果内容过大，有可能会将内存溢出，可以使用for循环单行读入，或者read（n）限制一次性读写字节数。

2.2、写相关操作

2.2.1、一次性多行写入 writelines

f.writelines()：
with open('h.txt',mode='wt',encoding='utf-8') as f:
#使用write写入    
     f.write('1111
222
3333
')
#使用for循环+write写入
    # l=['11111
','2222','3333',4444]
    l=['11111
','2222','3333']
     for line in l:
         f.write(line)
#使用writelines写入
    f.writelines(l)

2.2.2、b模式下文件的写入

with open('h.txt', mode='wb') as f:
    l = [
        '1111aaa1
'.encode('utf-8'),
        '222bb2'.encode('utf-8'),
        '33eee33'.encode('utf-8')
    ]

    # 补充1：如果是纯英文字符，可以直接加前缀b得到bytes类型
    l = [
        b'1111aaa1
',
        b'222bb2',
        b'33eee33'
    ]

    # 补充2：'上'.encode('utf-8') 等同于bytes('上',encoding='utf-8')
    l = [
        bytes('上啊',encoding='utf-8'),
        bytes('冲呀',encoding='utf-8'),
        bytes('小垃圾们',encoding='utf-8'),
    ]
    f.writelines(l)

2.3、立即写入硬盘 flush

with open('h.txt', mode='wt',encoding='utf-8') as f:
    f.write('哈')
    # f.flush()

2.4、了解

with open('../../../../Desktop/Python课堂笔记/day12笔记/h.txt', mode='wt', encoding='utf-8') as f:
    print(f.readable())      判断文件是否可读
    print(f.writable())    判断文件是否可写
    print(f.encoding)     格式，如‘utf-8，’如果文件打开属性为b，则没有该属性
    print(f.name)         输出绝对路径

print(f.closed)      判断文件是否关闭

三、控制文件的指针移动

3.1、指针移动的单位都是以bytes/字节为单位的，但t模式下的read（n），n代表的是字符个数。

with open('aaa.txt',mode='rt',encoding='utf-8') as f:
    res=f.read(4)
    print(res)    #输出前四个字节

3.2、指针的移动 f.seek(a,b)

3.2.1、模式0，即b=0，参照物是文件开头位置

f.seek(9,0)
f.seek(3,0) # 3


 with open('aaa.txt',mode='rb') as f:
     f.seek(9,0)
     f.seek(3,0) # 3
     # print(f.tell())
     f.seek(4,0)
     res=f.read()
     print(res.decode('utf-8'))

3.2.2、模式1，即b=1，参照物是当前指针位置

f.seek(9,1)
f.seek(3,1) # 12

with open('aaa.txt',mode='rb') as f:
    f.seek(9,1)
    f.seek(3,1) # 12
    print(f.tell())

3.2.3、模式2，即b=2，参照物是文件结尾

f.seek(-9,2) # 3
f.seek(-3,2) # 9

with open('aaa.txt',mode='rb') as f:
    f.seek(-9,2)
    # print(f.tell())
    f.seek(-3,2)
    # print(f.tell())
    print(f.read().decode('utf-8'))

注意：0模式可以在t模式下使用，0和1以及2可以在b模式下使用

3.2.4、当前指针位置 f.tell()

f.tell() # 获取文件指针当前位置

3.3、练习

　　实现动态时刻更新日志的效果

import time
with open('acess.log',mode='rb')as f:
    f.seek(0,2)
    while 1:
        line = f.readline()
        if len(line) ==0:
            time.sleep(0.3)
        else:
            print(line.decode('utf-8'),end=)

查看全文

相关阅读:
Ubuntu 12.10 安装 jdk-7u10-linux-x64.tar.gz(转载)
Android-- FragmentStatePagerAdapter分页(转载)
Windows下安装Cygwin及包管理器apt-cyg（转）
Androidi性能优化之多线程和同步
 Androidi性能优化之高效使用内存
 综合面试---常问知识点
 路由器
 域名系统
 IP地址与子网掩码
 网络层使用的协议

原文地址：https://www.cnblogs.com/jingpeng/p/12507120.html