一、t模式与b模式的区别
1.1、控制文件读写内容的模式
1.1.1、t 模式
(1)读写都是以字符串(unicode)为单位
(2)读写只能针对文本
(3)必须指定字符编码,即必须指定encoding参数
1.1.2、b 参数
(1)读写都是以二进制(bytes)为单位
(2)可以针对任意类型文件
(3)一定不能指定字符编码,即不能指定encoding参数
(4)需要手动编码解码
1.1.3、总结
(1)在纯文本文件操作时,使用t模式可以帮我们省去编码和解码的过程,b模式则需要手动去编码和解码,所以此时t模式更加的方便。
(2)针对非文本文件(图片,视频等)时,只能使用b模式进行操作,
1.2、 b 模式下对文件一次性的读写
1.2.1、读取文件 rb
with open(r'd.txt',mode='rb') as f: res=f.read() # utf-8的二进制 print(res,type(res)) # 读出二进制代码 print(res.decode('utf-8')) # 读出文件内容
1.2.2、 写入文件 wb
with open(r'f.txt',mode='wb') as f: f.write('你好hello'.encode('utf-8')) #必须加入encode f.write('哈哈哈'.encode('gbk')) #读取时只能以gbk模式或者utf-8读写
1.2.3、文件拷贝工具 rb+wb
src_file=input('源文件路径>>: ').strip() dst_file=input('源文件路径>>: ').strip() with open(r'{}'.format(src_file),mode='rb') as f1, open(r'{}'.format(dst_file),mode='wb') as f2: res=f1.read() # 存在内存占用过大的可能 f2.write(res) for line in f1: #优化的方法 f2.write(line)
1.3、循环读取文件,分次读写
1.3.1、以字节为单位,自己控制每次自己读取数据的数据量
with open(r'test.jpg',mode='rb') as f: while True: res=f.read(1024) # 1024 if len(res) == 0: break print(len(res))
1.3.2、以每行为单位进行读写,但是也有可能出现一次性单行读出数据量过大
1.3.2.1、w模式下for循环读文件
with open(r'g.txt',mode='rt',encoding='utf-8') as f: for line in f: print(len(line),line)
1.3.2.2、b模式下for循环读文件
with open(r'g.txt',mode='rb') as f: for line in f: print(line)#文件内容均为字母或数字,否则需要加encode
1.3.2.3、b模式下for循环读图片
with open(r'test.jpg',mode='rb') as f: for line in f: print(line) #此内容为数字和字母形式,没有加encode
二、文件操作的其他方法
2.1、读相关操作
2.1.1、w模式下while循环读文件,readline(一次只能读一行)
with open(r'g.txt',mode='rt',encoding='utf-8') as f: res1=f.readline() res2=f.readline() print(res2) #使用while循环读取 while True: line=f.readline() if len(line) == 0: break print(line)
2.1.2、b模式下,一次性多行读写。存为列表形式。readlines
with open(r'g.txt',mode='rt',encoding='utf-8') as f: res=f.readlines() print(res)
2.1.3、read和readlines的区别
read是按照文件内容直接读出,readlines是将文件内容以列表的形式读出
注:read和readlines都是将文件内容一次性读入内存,如果内容过大,有可能会将内存溢出,可以使用for循环单行读入,或者read(n)限制一次性读写字节数。
2.2、写相关操作
2.2.1、一次性多行写入 writelines
f.writelines(): with open('h.txt',mode='wt',encoding='utf-8') as f: #使用write写入 f.write('1111 222 3333 ') #使用for循环+write写入 # l=['11111 ','2222','3333',4444] l=['11111 ','2222','3333'] for line in l: f.write(line) #使用writelines写入 f.writelines(l)
2.2.2、b模式下文件的写入
with open('h.txt', mode='wb') as f: l = [ '1111aaa1 '.encode('utf-8'), '222bb2'.encode('utf-8'), '33eee33'.encode('utf-8') ] # 补充1:如果是纯英文字符,可以直接加前缀b得到bytes类型 l = [ b'1111aaa1 ', b'222bb2', b'33eee33' ] # 补充2:'上'.encode('utf-8') 等同于bytes('上',encoding='utf-8') l = [ bytes('上啊',encoding='utf-8'), bytes('冲呀',encoding='utf-8'), bytes('小垃圾们',encoding='utf-8'), ] f.writelines(l)
2.3、立即写入硬盘 flush
with open('h.txt', mode='wt',encoding='utf-8') as f: f.write('哈') # f.flush()
2.4、了解
with open('../../../../Desktop/Python课堂笔记/day12笔记/h.txt', mode='wt', encoding='utf-8') as f: print(f.readable()) 判断文件是否可读 print(f.writable()) 判断文件是否可写 print(f.encoding) 格式,如‘utf-8,’如果文件打开属性为b,则没有该属性 print(f.name) 输出绝对路径 print(f.closed) 判断文件是否关闭
三、控制文件的指针移动
3.1、指针移动的单位都是以bytes/字节为单位的,但t模式下的read(n),n代表的是字符个数。
with open('aaa.txt',mode='rt',encoding='utf-8') as f: res=f.read(4) print(res) #输出前四个字节
3.2、指针的移动 f.seek(a,b)
3.2.1、模式0,即b=0,参照物是文件开头位置
f.seek(9,0) f.seek(3,0) # 3
with open('aaa.txt',mode='rb') as f:
f.seek(9,0)
f.seek(3,0) # 3
# print(f.tell())
f.seek(4,0)
res=f.read()
print(res.decode('utf-8'))
3.2.2、模式1,即b=1,参照物是当前指针位置
f.seek(9,1) f.seek(3,1) # 12
with open('aaa.txt',mode='rb') as f:
f.seek(9,1)
f.seek(3,1) # 12
print(f.tell())
3.2.3、模式2,即b=2,参照物是文件结尾
f.seek(-9,2) # 3 f.seek(-3,2) # 9
with open('aaa.txt',mode='rb') as f:
f.seek(-9,2)
# print(f.tell())
f.seek(-3,2)
# print(f.tell())
print(f.read().decode('utf-8'))
注意:0模式可以在t模式下使用,0和1以及2可以在b模式下使用
3.2.4、当前指针位置 f.tell()
f.tell() # 获取文件指针当前位置
3.3、练习
实现动态时刻更新日志的效果
import time with open('acess.log',mode='rb')as f: f.seek(0,2) while 1: line = f.readline() if len(line) ==0: time.sleep(0.3) else: print(line.decode('utf-8'),end=)