文件操作
一般步骤1. 文件打开 2. 文件操作 3. 文件关闭
1. 打开文件
使用open(文件名(绝对路径), 打开模式, 编码)
文件打开的模式有:
r: 只读模式(默认)
w: 只写模式 (不可读,文件不存在就创建,存在则清空)
x: 只写模式 (不可读,文件不存在就创建,存在则报错)
a: 追加模式 (不可读,如果文件不存在就创建,如果存在则在原文件后面追加)
以上都是以字符串方式打开
'+' 表示可以同时读写某个文件
'b' 表示以字节的方式操作 -> 后续socket部分会用到
文件的打开方式有 普通打开方式 和 二进制打开方式
普通打开:python内部将0101自动转换成字符串
二进制打开:'b'模式加str - bytes 转换 + 手动encoding='utf-8'
1 # 打开一个文件使用open(文件名(绝对路径),打开模式,编码) 2 # 文件打开默认只读模式('r') 3 # 4 f = open('test.log', 'r') 5 data = f.read() 6 f.close() 7 print(data) 8 9 f = open('test.log', 'r') 10 data = f.write('ehhh') 11 f.close() 12 print(data) 13 # 在只读状态下写入,报错 Traceback (most recent call last): 14 # File "D:/NaomiPyer/naomi_01/mod8/file_stuff.py", line 21, in <module> 15 # data = f.write('ehhh') 16 # io.UnsupportedOperation: not writable 17 18 # 只写 - 文件不可读,只写情况下,文件不存在则创建,存在则清空内容写入 19 f = open('test1.log', 'w') 20 f.write('ruby') 21 f.close() 22 # 执行后自动创建了有'ruby'内容的文件 23 f = open('test1.log', 'w') 24 f.write('python') 25 f.close() 26 # 修改写入内容再次执行,文件内容更新为新输入的内容 27 f = open('test1.log', 'w') 28 f.read() 29 # 报错, 不可读 => io.UnsupportedOperation: not readable 30 31 # x 只写 - 不可读,不存在则创建,存在则报错 32 f = open('test1.log', 'x') 33 f.write(' ') 34 f.close() 35 # 文件已存在,报错 => FileExistsError: [Errno 17] File exists: 'test1.log' 36 37 # a 追加 - 不可读,不存在则创建,存在则只追加内容 38 f = open('test.log', 'a') 39 f.write('java') 40 f.close() 41 # 'test.log'文件里面追加了java 内容 42 43 # 以上为文件的基本打开方式 44 # 通常读取到的文件数据,类型是str, 如果要转换为字节,可以用types() 45 f = open('test.log', 'r') 46 data = f.read() 47 a = bytes(data, encoding='utf-8') 48 print(a) 49 # 这样文件里的数据就以bytes输出了 => b'zen of pythonjava' 50 51 # 以字节方式打开 52 # 1. 只读 53 f = open('test.log', 'rb') 54 data = f.read() 55 print(data) 56 str_data = str(data, encoding='utf-8') 57 print(str_data) 58 # 不需要编码 59 60 # 2. 只写 61 f = open('test.log', 'wb') 62 f.write(bytes('牛奶', encoding='utf-8')) 63 f.close() 64 # 写入的字符串"牛奶"需要用编码变为bytes写入 65 f = open('test1.log', 'wb') 66 str_data = '牛奶' 67 bytes_data = bytes(str_data, encoding='utf-8') 68 f.write(bytes_data) 69 f.close() 70 # 以字节的方式写入
'+'
r+ 读写
1 # r+ 2 # w, 末尾追加,指针最后 3 f = open('test1.log', 'r+', encoding='utf-8') 4 5 # 指针为0, 起始位置 6 print(f.tell()) 7 8 data = f.read(3) # read(3) 读取3个字符(中文9个字节) 9 print(type(data), data) 10 print(f.tell()) 11 # f.write('草莓') 12 # f.seek(0) 13 # data = f.read() 14 f.read(2) 15 print(f.tell()) 16 print(type(data), data) 17 f.close() 18 # 指针 读取完数据,继续读取的时候从上次停下的位置开始继续读取 19 # 通过tell() 来获取指针 20 # 通过seek() 来调整指针 [seek以字节来说] 21 # 写入的时候,指针会调到最后
w+ 写读
1 # w+,先清空,写完内容之后才可以读 2 # 写入完毕,指针到最后 3 f = open('test1.log', 'w+', encoding='utf-8') 4 data = f.read() 5 f.close() 6 print(data) 7 # 没有数据,因为写读是先写入再读取,没有写入的内容 8 f = open('test1.log', 'w+', encoding='utf-8') 9 f.write('鸡蛋') 10 data = f.read() 11 f.close() 12 print(data) 13 # 还是没有内容,因为写完之后指针已经到文件末尾 14 f = open('test1.log', 'w+', encoding='utf-8') 15 f.write('鸡蛋') 16 f.seek(0) 17 data = f.read() 18 f.close() 19 print(data) 20 # 写入数据后,调整指针到起始位置,读到文件内容
x+ 写读
基本和 w+ 一样,不同的是,如果文件已经存在,会报错。
a+ 写读
1 # a+ 2 # 写时追加,放到最后 3 f = open('test.log', 'a+', encoding='utf-8') 4 print(f.tell()) 5 data = f.read() 6 print(data) 7 f.seek(0) 8 data = f.read() 9 print(data) 10 f.close() 11 # 因为a是追加,其实在打开文件的同时,指针已经到了文件末尾 12 # => 6 空 牛奶
几种读写方式共有的特点
1 # 从开始向后读 2 # 写,追加,指针调到最后 3 f.tell() # 获取指针的位置 4 f.seek(num) # 调整指针的位置 5 data = f.read(1) # 读取一个字符(中文3个字节) 6 print(data) 7 print(f.tell()) # 向后移了三个字节 8 f.write('content') # 在尾部追加,并且指针移动到最后 9 f.close()
在不确定每个读写方式特点的时候,可以通过tell(), seek(), read(), write() 方法来判断
'b' 表示以字节的方式操作
wb w+b
rb r+b
xb x+b
ab a+b
上述是和在底层数据交流的时候,以字节的方式读写,默认以字节方式打开,拿到字节数据后转化为字符串进行操作,写入的时候同样转换为字节写入。
文件的操作:
1 # close() 关闭一个文件 2 3 # fileno() 文件描述符(后续讲) 4 5 # flush() 文件内部缓冲区 6 # 写入内容之后,f.flush()可以将内存里写入的东西刷入到硬盘里 7 8 # read(1) 读取内容 9 10 # readable() 判断是否可读 11 12 # readline(1) 仅读取一行内容,再次执行会从第一次指针停下来的位置继续往下读取 13 14 # seek() 调整指针 15 16 # truncate() 截取, 依赖于指针 17 18 f = open("test.log", 'r', encoding='utf-8') 19 # f.read() 20 for line in f: 21 print(line) 22 # 效果同readline(),且比readline()更好用 23 24 # 关闭文件 close() 25 # 每次文件读写都要close(),比较麻烦,可以通过with语句来自动关闭 26 with open('test.log', 'r') as f: 27 f.read() 28 # 读取数据时,上面代码自动帮助close()文件 29 # python 2.7 及以后版本,可以同时还打开两个文件 30 with open('log1', 'r') as obj1, open('log2', 'r') as obj2: 31 pass 32 # 以读方式打开源文件,同时打开新文件w,可以一行一行读取然后一行一行写入新文件。大大节省了内存。 33 with open('源文件', 'r') as obj1, open('新文件', 'w') as obj2: 34 for line in obj1: 35 obj2.write(line)
文件关闭后不会保存指针,但是关闭前,文件读到哪儿,指针就指到哪儿。
如果需要记录文件读取的位置,我们可以将tell()指针位置先保存起来,下一次打开的时候seek()一下重新读取