一、文件与文件的模式
1、什么是文件
文件是操作系统提供给用户/应用程序操作硬盘的一种虚拟的概念/接口。
用户/应用程序(open())
操作系统(文件)
计算机硬件(硬盘)
2、为何要用文件
(1)应用程序运行过程中产生的数据最先都是存放于内存中的,用户/应用程序可以通过文件将数据永久保存的硬盘中。
即操作文件就是操作硬盘。
(2)应用程序若想操作硬件必须通过操作系统,用户/应用程序直接操作的是文件(文件就是操作系统提供给应用程序来操作硬盘的虚拟概念),对文件进行的所有的操作,都是在向操作系统发送系统调用,然后由操作系统完成对硬盘的具体操作。
3、如何用文件:open()
(1)控制文件读写内容的模式:t和b
强调:t和b不能单独使用,必须跟r/w/a连用
* t文本(默认的模式):
1、读写都以str(unicode)为单位的
2、文本文件
3、必须指定encoding='utf-8'
* b二进制/bytes
(2)控制文件读写操作的模式
Ⅰ.r只读模式:在文件不存在时则报错,文件存在文件内指针直接跳到文件开头,可用于系统登录功能。
Ⅱ.w只写模式:在文件不存在时会创建空文档,文件存在会清空文件,文件指针跑到文件开头。可用于文本文件的复制。
# 在文件不关闭的情况下,连续的写入,后写的内容一定跟在前写内容的后面。
# 如果重新以w模式打开文件,则会清空文件内容。
Ⅲ.a只追加写模式:在文件不存在时会创建空文档,文件存在会将文件指针直接移动到文件末尾。可用于注册账号功能。
#强调 w 模式与 a 模式的异同:
#相同点:在打开的文件不关闭的情况下,连续的写入,新写的内容总会跟在前写的内容之后。
#不同点:以 a 模式重新打开文件,不会清空原文件内容,会将文件指针直接移动到文件末尾,新写的内容永远写在最后。
Ⅳ.+:r+、w+、a+ # 可读可写
二、文件操作
1、打开文件
# windows路径分隔符问题 open('C:a.txt bcd.txt')
# 解决方案一:推荐r
# open(r'C:a.txt bcd.txt')
# 解决方案二:斜杠/
# open('C:/a.txt/nb/c/d.txt')
f=open(r'aaa/a.txt',mode='rt') # f的值是一种变量,占用的是应用程序的内存空间
2、操作文件:读/写文件,应用程序对文件的读写请求都是在向操作系统发送系统调用,然后由操作系统控制硬盘把输入读入内存、或者写入硬盘。
res=f.read()
3、关闭文件
文件。在操作完毕一个文件时,必须把与该文件的这两部分资源全部回收,回收方法为:
f.close() # 回收操作系统资源
del f # 回收应用程序资源
del f一定要发生在f.close()之后,否则就会导致操作系统打开的文件无法关闭,白白占用资源,而python自动的垃圾回收机制决定了我们无需考虑del f,这就要求我们,在操作完毕文件后,一定要记住f.close()。
三、with上下文管理
1、在执行完子代码块后,with 会自动执行f.close()
with open('a.txt','w') as f:
pass
2、可用用with同时打开多个文件,用逗号分隔开即可with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
data = read_f.read()
write_f.write(data)
四、指定文件的操作编码
f = open(...)是由操作系统打开文件
如果打开的是文本文件,会涉及到字符编码问题,如果没有为open指定编码,操作系统会用自己的默认编码去打开文件,在windows下是GBK,在linux下是utf-8。若要保证不乱码,文件以什么方式存的,就要以什么方式打开。
例:f = open('a.txt','r',encoding='utf-8')