一、文件处理:
1、什么是文件:
文件是操作系统为应用程序和用户提供操作硬盘的一种虚拟单位
强调:
文件是操作系统提供的虚拟单位
应用程序或用户对文件的读写操作都是向操作系统发送指令
2、为何要用文件:
文件对应的硬盘空间,如果考虑需要永久保存数据那必须使用文件
3、如何用文件
路径问题
绝对路径:
win:C:acd.txt
linux:/a/b/c/d.txt
相对路径:相对于当前执行文件的所在的文件夹
acd.txt
(1)打开文件:
例:f=open(r'D:脱产5期内容day09a.txt',mode='rt',encoding='utf-8') print(f)
(2)读/写文件
data=f.read() print(data)
(3)关闭文件
f.close()#向操作系统发送指令,让操作系统关闭打开的文件,回收操作资源 print(f) f.read
上下文管理
with open('a.txt',mode='rt',encoding='utf-8') as f: data=f.read() print(data)
二、文件的打开模式
1、基本介绍
控制文件读写操作的模式
r(默认)
w
a
控制文件读写内容的模式(不能单独使用必须与r、w、a同时使用)
t(默认)
d
2、详细介绍
控制文件读写操作的模式
r(默认)只读模式,当文件不存在是则报错,当文件存在是文件指针在文件开头
例:with open('a.txt',mode='rt',encoding='utf-8') as f: data=f.read() print(f.readable()) print(f.writable())
line=f.readline()
# print(line,end='')
#
# line = f.readline()
# print(line,end='')
#
# print('第三次读')
# line = f.readline()
# print(line, end='')
# print(data,type(data))
# for line in f:
# print(line)
# print(f.readlines())
# pass
w 只写模式,以该模式打开文件当文件不存在时创建一个新的文件,当文件存在时清空文件内容,文件指针在文件开头
with open('a.txt',mode='wt',encoding='utf-8') as f: print(f.readable()) print(f.writable()) 在打开了文件不关闭的情况下,连续的写入,新写的内容总是跟在老内容之后 f.write('你瞅啥 ') f.write('瞅你那熊样 ') f.write('巴拉巴拉。。。 ') lines=['1111 ','2222 ','3333 '] for line in lines: f.write(line) f.writelines(lines) f.write('aaaa bbb cccc ')
a 只追加写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时不清空文件内容,文件指针跳至文件末尾
with open('c.txt',mode='at',encoding='utf-8') as f: f.write('你好阿斯蒂芬 ') f.write('adfasdf ') f.writelines([1,2,3])
控制文件读写内容的模式(不能单独使用必须与r、w、a同时使用)
t(默认)无论读写都以字符为单位的,只能操作文本文件必须指定encoding参数
d 无论读写都以bytes为单位的,可以操作所有文件,一定不能指定encoding参数
with open('a.txt',mode='rb') as f: data=f.read() print(data,type(data)) print(data.decode('utf-8')) with open('01.mp4',mode='rb') as f: data=f.read() print(data,type(data)) with open('a.txt',mode='wb') as f: f.write('字符行啊士大夫阿斯蒂芬撒旦发'.encode('utf-8'))
练习:拷贝文件小程序
with open('01.mp4',mode='rb',) as read_f, open(r'D:1111.mp4',mode='wb') as write_f: data=read_f.read() write_f.write(data) 了解: +:不能单独使用,必须与rwa连用,r+ w+ a+ with open('a.txt','r+t',encoding='utf-8') as f: # print(f.readable()) # print(f.writable()) data=f.readline() print(data) f.write('刘清蒸')
with open('a.txt','r+t',encoding='utf-8') as f:
# print(f.readable())
# print(f.writable())
f.seek(10)
# print(f.tell())
f.write('你好啊')
三、文件修改的两种方式
1、方式一
1、以读的方式打开源文件
2、将文件内容一次性读入内存
3、以写的方式打开源文件,然后将写好的源文件次性写入源文件
总结
优点:在文件修改过程中硬盘只存一份数据
缺点:浪费内存
with open('b.txt',mode='rt',encoding='utf-8') as f1: msg=f1.read() new_msg=msg.replace('alex','大SB') with open('b.txt',mode='wt',encoding='utf-8') as f2: f2.write(new_msg)
方式二
1、以读的方式打开源文件,以写的方式打开一个临时文件
2、读取源文件的内容到内存中,将修改的结果写入临时文件,循环往复直到改完
3、删除源文件,将临时文件重命名为源文件名
优点:同一时间内内存中只有一份文件的一行内容,更节省内存
缺点:在文件修改过程中硬盘中存在两份数据
import os with open('b.txt',mode='rt',encoding='utf-8') as read_f, open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f: for line in read_f: write_f.write(line.replace('大SB','alex')) os.remove('b.txt') os.rename('.b.txt.swap','b.txt')
四、控制文件内鼠标的移动
强调:只有t模式下read(n),n代表字符个数,其他的都是以字节为单位
with open('a.txt',mode='rt',encoding='utf-8') as f: res=f.read(4) print(res) with open('a.txt',mode='rb') as f: res=f.read(3) print(res.decode('utf-8')) with open('a.txt',mode='at',encoding='utf-8') as f: f.truncate(3)
f.seek():指针移动是靠字节为单位的
三种模式,只有0模式既可以在t下用也可以在b模式下用,而1、2两种模式只能在b模式向用
0(默认的)的参照文件开头
with open('a.txt',mode='rt',encoding='utf-8') as f: f.seek(3,0) print(f.tell()) print(f.read())
1 参照指针当前所在的位置
with open('a.txt',mode='rb') as f: f.read(2) f.seek(4,1) print(f.tell()) print(f.read().decode('utf-8'))
2 参照文件末尾
with open('a.txt',mode='rb') as f: f.seek(-5,2) print(f.tell()) print(f.read().decode('utf-8'))
import time with open('access.log',mode='rb') as f: f.seek(0,2) while True: line=f.readline() if len(line) == 0: time.sleep(0.1) else: print(line.decode('utf-8'),end='')