python的文件处理函数是open()
以下主要是关于这个函数的一些学习笔记
1、文件处理离不开编码
要注意的是文件打开时的编码和文件保存时的编码的统一,这样才能保证你打开的文件不会存在乱码
总结:创建文件、打开读取文件、写文件保存文件时的编码必须统一,否则可能存在乱码问题
2、操作文件时要有始有终
意思就是当你打开文件的时候,要记得关闭文件操作。否则会浪费系统的资源。
3、open函数(重点)
(1)、open的语法
open('文件路径','操作模式','编码')
例子:
new_file = open('newfile.txt','w',encoding='utf-8')
#这里是以utf8编码,以写的模式打开文件newfile.txt,new_file为在系统中获得的文件句柄,只有获得了文件句柄才能操作文件 data = 'my test data' new_file.write(data) new_file.close()
(2)、open函数的文件操作模式
r模式:只读模式,是open函数的默认模式,如果不是特殊指定,默认以r模式打开。
w模式:只写模式,指定了此种模式的话文件只能写,不能读。
注意:如果只有w模式的话,打开文件的时候会清空文件内容重新开始写操作。如果文件不存在就创建
x模式:只写模式,只能写不能读,和w模式的区别就在,如果文件存在就报错,不存在会创建新文件
a模式:追加模式,指定此模式的话文件是以最佳的模式在文件最末尾开始写操作。
r+模式:读写模式,此模式下文件既可以读又可以写。
w+模式:写读模式,此模式下可以写也可以读,
注意的是,指定这种模式的话也会清空文件从新开始写。如果文件不存在就创建。
x+模式:写读模式
注意:和w+的区别就是,如果文件存在就报错,如果不存在就重新创建
a+模式:写读追加模式:
rb模式:以二进制的模式进行读文件操作
wb模式:以二进制的模式进行写操作
xb模式:以二进制的模式进行写操作
ab模式:以二进制的模式进行追加写操作
注意1:如果你写的代码存在跨平台的话,就要以二进制的模式进行读写操作。
注意2:如果要以二进制的模式进行读写操作,内容需要进行编码转换才便于直观的读写。
例子:
new_file = open('newfile1.txt','wb')
data = '这里我要写内容了,test data '
new_file.write(data.encode('utf-8'))
new_file.close()
(3)、文件内置方法flush
这里要清楚的一个概念是,文件的数据操作,都是在内存进行的,如果没有flush或者close的话,是不会落地到文件的。
例子:
import time with open('newfile.txt','r+') as f: list = ['aaaaa ','bbbbbb ','ccccc ','ddddd '] for i in list: f.write(i) f.flush() time.sleep(2)
以上例子就可以看出效果每写一行,你在打开的文件刷新一下就能看到数据落地到文件。
(4)、TextIOWrapper的相关方法
def close(self): #保存和关闭文件 """Flush and close this stream. :rtype: None """ pass def fileno(self): # 返回一个整型的文件描述符(file descriptor FD 整型),可用于底层操作系统的 I/O 操作。 """Return the underlying file descriptor (an integer) of the stream if it exists. :rtype: int """ return 0 def flush(self): # 将内存的数据刷新到文件里 """Flush the write buffers of the stream if applicable. :rtype: None """ pass def isatty(self): # 如果文件连接到一个终端设备返回 True,否则返回 False。 """Return True if the stream is interactive (i.e., connected to a terminal/tty device). :rtype: bool """ return False def readable(self): # 判断文件当前状态是否刻度 """Return True if the stream can be read from. :rtype: bool """ return False def readline(self, limit=-1): # 读取整行,包括‘ ’字符 """Read and return one line from the stream. :type limit: numbers.Integral :rtype: unicode """ pass def readlines(self, hint=-1): # 读取所有行,并以列表的形式返回 """Read and return a list of lines from the stream. :type hint: numbers.Integral :rtype: list[unicode] """ return [] def seek(self, offset, whence=io.SEEK_SET): #获取当前光标所在的位置 """Change the stream position to the given byte offset. :type offset: numbers.Integral :type whence: numbers.Integral :rtype: None """ pass def seekable(self): # 是否可获取文件当前的位置 """Return True if the stream supports random access. :rtype: bool """ return False def tell(self): # 返回文件当前位置 """Return the current stream position. :rtype: int """ return 0 def truncate(self, size=None): #截取文件,截取的字节通过死泽指定。默认为当前的文件位置 """Resize the stream to the given size in bytes (or the current position if size is not specified). :type size: numbers.Integral | None :rtype: None """ pass def writable(self): #文件当前状态是否可写 """Return True if the stream supports writing. :rtype: bool """ return False def writelines(self, lines): # 向文件写入一个序列字符串列表,如果需要换行则要加入每一行的换行符。 """Write a list of lines to the stream. :type lines: collections.Iterable[unicode] :rtype: None """ pass
下面有关一个seek获取文件最后一行的操作例子:
with open('newfile.txt','rb+') as f: #for i in f: #这里的for循环是可以拿掉的,如果文件很大最好加上这个for循环 offs = -10 #设置一个偏移量 while True: f.seek(offs,2) # 通过偏移量从文件的末尾往前读文件, data = f.readlines() #将读到的文件以列表的形式返回 if len(data) > 1: #大于1代表已经读取到了最后一行和倒数第二行的某几个字节,这样取列表最后一个元素就是文件的最后一行 print("文件的最后一行:%s" %(data[-1].decode('utf-8'))) break offs *= 2 #如果等于1 那就有可能偏移量太小而导致最后一行读不全。
4、让系统帮我们自动关闭文件句柄
这里就要用到with open('文件路径','操作模式') as f:
例子:
with open('newfile1.txt','rb+') as f:
data = f.read()
print(data.decode('utf-8'))