1、文件IO常用操作
# 文件操作命令
2、打开操作open
# open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
创建并打开一个文件test,然后关闭;
打开一个文件,返回一个文件对象(流对象)和文件描述符。
打开文件失败,则返回异常;
touch test #linux #New-Item "new test.txt" -type File #powershell f = open("test") # file对象 # windows <_io.TextIOWrapper name='test' mode='r' encoding='cp936'>
# linux <_io.TextIOWrapper name='test' mode='r' encoding='UTF-8'> print(f.read()) # 读取文件 f.close() # 关闭文件
# open参数详解
①:file 打开或者要创建的文件名,如果不指定路径,默认是当前路径或者是文件描述符(整型)
②:mode模式:文件打开的模式。默认以文本只读 mode=rt
的模式打开已经存在的文件;
③:文件指针:文件指针,指向当前字节位置;
# f.seek(offset,whence=0,/) f 为文件对象,改变文件流的位置;offset表示相对于whence偏移了多少字节;
# whence 有三个值可选,分别表示不同的相对位置
- 0,文件开头,默认为0;
- 1,当前位置;
- 2,文件末尾;
# 文本模式下:支持从开头向后偏移的。whence=1 表示从当前位置开始偏移,但是offset 只能为0,相当于原地不动。whence=2 表示从文本末尾开始偏移,offset 只能为0,seek 是按照字节偏移的;
# 1和2,在文本模式下,无法移动;1和2只有在字节模式下才能移动光标;
# 二进制模式下:默认whence=0,从文件开头开始,offset只能是正整数。whence=1,offset可正可负。whence=2,offset可正可负。二进制模式支持任意起点的偏移,向后seek可以超界,但是向前的seek不可以超界,否则抛出异常;
# 注意:seek移动,会自动调用flush;
④:缓冲区
# buffer缓冲区:缓冲区是一个内存空间,一般来说是一个FIFO队列,到缓冲区满了或者达到阈值的时候,数据才会flush 到磁盘中。flush() 将缓冲区数据写入磁盘close()关闭前会调用flush();
⑤:encoding
None 表示使用缺省编码,依赖操作系统。
windows默认是GBK(cp936)。
linux默认是UTF-8
⑥:其他参数
errors: 编码错误将被捕获,None和strict表示有编码错误将抛出ValueError错误,ignore表示忽略。
newline:
文本模式中,换行的转换;
可以为None,“空串”,' ',' ',' '
读取时 None表示:' ',' ',' '都被转换为" ";
’’表示不会自动转换通用换行符;
其它合法字符表示换行符就是指定字符,就会按照指定字符分行 写 时,None表示’ ’都会被替换为系统缺省行分隔符os.linesep;’ ’或’’表示’ ’不替换;其它合法字符表示’ ’会被 替换为指定的字符。
closefd 关闭文件描述符,True表示关闭它。False会在文件关闭后保持这个描述符。fileobj.fileno()查看;
3、read
# fileobj.read(size=-1, /)
size表示读取的多少个字符或字节;负数或者None表示读取到EOF;
# readline(size=-1)
一行行读取文件内容。size设置一次能读取行内几个字符或字节;
# readlines(hint=-1)
读取所有行的列表。指定hint则返回指定的行数;
4、write
# fileobj.write(s, /)
把字符串s写入到文件中并返回字符的个数。
writelines(lines),将字符串列表写入文件;
5、close
flush 并关闭文件对象。
文件已经关闭,再次关闭没有任何 效果;
6、上下文管理
# 对于一个打开的文件句柄,需要使用完后要关闭,不然就会浪费计算机资源;而关闭的方法:
①:手动关闭,f.close()
②:使用with...as语法,自动关闭;
- 交给python解释器释放文件对象:
with open('a.txt',encoding='utf-8') as f: line=f.read() print(line) ############################## f=open('a.txt',encoding='utf-8') with f: g=f.readline() print(g)
# 上下文管理的语句块并不会开启新的作用域;
# with语句块执行完毕,会自动关闭文件对象;
注意:对于类似于文件对象的IO对象,一般来说都需要在不使用的时候关闭、注销,以释放资源。 IO被打开的时候,会获得一个文件描述符。计算机资源是有限的,所以操作系统都会做限制。就是为了保护计算机 的资源不要被完全耗尽,计算资源是共享的,不是独占的。 一般情况下,除非特别明确的知道资源情况,否则不要提高资源的限制值来解决问题。