zoukankan html css js c++ java

文件处理

什么是文件？

简单来说：文件是操作系统提供给你一个操作硬盘的接口

详细来说：在应用程序运行过程中产生的数据最先都是存放于内存中的，若想永久保存下来，必须要保存于硬盘中。应用程序若想操作硬件必须通过操作系统，而文件就是操作系统提供给应用程序来操作硬盘的虚拟概念，用户或应用程序对文件的操作，就是向操作系统发起调用，然后由操作系统完成对硬盘的具体操作。

为什么要用文件？

人们要用计算机永久保存数据

怎么用文件？

引入文件操作的方法

# 1. 打开文件，由应用程序向操作系统发起系统调用open(...)，操作系统打开该文件，对应一块硬盘空间，并返回一个文件对象赋值给一个变量f(文件句柄)
f=open('a.txt','r',encoding='utf-8')
f = open('文件路径', '打开文件的模式默认为r', encoding='指定打开文件的字符编码')
f = open(...)是由操作系统打开文件，如果打开的是文本文件，会涉及到字符编码问题，如果没有为open指定编码，那么打开文本文件的默认编码就是操作系统说了算，操作系统会用自己的默认编码去打开文件，在windows下是gbk，在linux下是utf-8。
PS：若要保证不乱码，文件以什么方式存的，就要以什么方式打开。
f = open('a.txt','r',encoding='utf-8')

# 2. 调用文件对象下的读/写方法，会被操作系统转换为读/写硬盘的操作
data=f.read()

# 3. 向操作系统发起关闭文件的请求，回收系统资源
f.close()

1 由应用程序或用户本身发起对某个文件的请求

2 操作系统根据请求调用相应的文件接口

3 操作系统去硬件层面(硬盘)找到该文件

资源回收与with上下文管理

打开一个文件包含两部分资源：应用程序的变量f和操作系统打开的文件

#回收文件也有两部分
del f #回收应用程序的变量,不需要人类去做,python中的垃圾回收机制会自动清理
f.close() #回收操作系统打开的文件资源,需要我们自己去做，且该操作要在del f之前,否则就会导致操作系统打开的文件无法关闭，白白占用资源

而with关键字的作用为:自动执行f.close()

#基本语法
with open('文件路径', '打开文件的模式',encoding='指定文件打开的字符编码')as f:
#可以用with同时打开多个文件,用逗号分隔开即可
with open('a.txt', 'r',encoding='utf-8')as rf,open('b.txt','w',encoding='utf-8')as wf:
    print(rf.read())#将读到的文件内容打印出来
    wf.write('bing')#将'bing'写入b.txt中

文件的操作模式

r(默认的)：只读
         1 只能读，不能写
         2 如果文件不存在的话，就会报错
w:只写
  1 只能写不能读
  2 如果文件不存在
  3 如果文件存在，会先清空原文件再写入新文件
a：追加写
  1 只能写，不能读
  2 如果文件不存在，会创建新文件
  3 如果文件存在，会在原数据的末尾追加新数据

使用方法

r模式的使用

with open('a.txt',mode='r',encoding='utf-8') as f:
     res=f.read() # 会将文件的内容由硬盘全部读入内存，赋值给res

w模式的使用

# w只写模式: 在文件不存在时会创建空文档,文件存在会清空文件,文件指针跑到文件开头
with open('a.txt',mode='w',encoding='utf-8') as f:
    f.write('啊啊啊')
#注意：
1 在文件不关闭的情况下，连续的写入，后写的内容一定跟在前面写的内容的后面
2 如果重新以w模式打开文件，则会清空文件内容

a模式的使用

# a只追加写模式: 在文件不存在时会创建空文档,文件存在会将文件指针直接移动到文件末尾
 with open('a.txt',mode='a',encoding='utf-8') as f:
     f.write('666')
#强调 w 模式与 a 模式的异同：
# 1 相同点：在打开的文件不关闭的情况下，连续的写入，新写的内容总会跟在前写的内容之后
# 2 不同点：以 a 模式重新打开文件，不会清空原文件内容，会将文件指针直接移动到文件末尾，新写的内容永远写在最后

纯净模式

# r+ w+ a+ :可读可写
#在平时工作中，我们只单纯使用r/w/a，要么只读，要么只写，一般不用可读可写的模式
#除了可读可写外，剩下的都是自己的特性
大前提: tb模式均不能单独使用,必须与r/w/a之一结合使用
t（默认的）：文本模式
    1. 读写文件都是以字符串为单位的
    2. 只能针对文本文件
    3. 必须指定encoding参数
b：二进制模式:
   1.读写文件都是以bytes/二进制为单位的
   2. 可以针对所有文件
   3. 一定不能指定encoding参数

t模式的使用

with open(r'a.txt', 'rt', encoding='utf-8')as f:
    res = f.read()
    print(res)
    print(type(res)) # 输出结果为：<class 'str'>
with open(r'a.txt', 'at', encoding='utf-8')as f:
    add = 'aaa'
    f.write(add) #写入的也必须是字符串类型
#注意：t 模式只能用于操作文本文件,无论读写，都应该以字符串为单位，而存取硬盘本质都是二进制的形式，当指定 t 模式时，内部帮我们做了编码与解码

b模式的使用

with open(r'加菲猫.jpg', 'rb')as f:
    print(f.read())
    
with open('a.txt',mode='wb')as f:
    msg = 'bing'
    res = msg.encode('utf-8') #python3中字符串的本质为unicode序列,而将内存中的unicode转化为硬盘中的utf-8，需要中间的encode(编码过程)，而硬盘中的数据是以二进制的字节存储的，所以res为bytes类型
    f.write(res)
总结：
b模式对比t模式
1、在操作纯文本文件方面t模式帮我们省去了编码与解码的环节，b模式则需要手动编码与解码，所以此时t模式更为方便
2、针对非文本文件（如图片、视频、音频等）只能使用b模式

操作文件的方法

#读
f.read() #读文件，一次性读出所有数据，文件指针会移动到文件末尾
f.readable #判断文件是否可读
f.readline() #一次读一行，光标移动到第二行首部
f.readlines() #将数据全部读入内存，以换行符分隔，存入列表
#写
f.write() #写文件(只能写str不能为list)
f.writable() #判断文件是否可写
f.writlines() #for + f.write()

主动控制文件内指针移动

with open('a.txt', mode='rt', encoding='utf-8')as f:
    res = f.read(2) #读取两个字符
with open('a.txt', mode='rb')as f:
    res = f.read(2) #读取两个字节
# 之前文件内指针的移动都是由读/写操作而被动触发的，若想读取文件某一特定位置的数据，则则需要用f.seek方法主动控制文件内指针的移动，详细用法如下：
# f.seek(指针移动的字节数,模式控制): 
# 模式控制:
# 0: 默认的模式,该模式代表指针移动的字节数是以文件开头为参照的
# 1: 该模式代表指针移动的字节数是以当前所在的位置为参照的
# 2: 该模式代表指针移动的字节数是以文件末尾的位置为参照的
# 强调:其中0模式可以在t或者b模式使用,而1跟2模式只能在b模式下用

0模式详解

# a.txt用utf-8编码，内容如下（abc各占1个字节，中文“你好”各占3个字节）
abc你好

# 0模式的使用
with open('a.txt',mode='rt',encoding='utf-8') as f:
    f.seek(3,0)     # 参照文件开头移动了3个字节
    print(f.tell()) # 查看当前文件指针距离文件开头的位置，输出结果为3
    print(f.read()) # 从第3个字节的位置读到文件末尾，输出结果为：你好
    # 注意：由于在t模式下，会将读取的内容自动解码，所以必须保证读取的内容是一个完整中文数据，否则解码失败

with open('a.txt',mode='rb') as f:
    f.seek(6,0)
    print(f.read().decode('utf-8')) #输出结果为: 好

1模式详解

with open('a.txt','rb')as f:
    f.seek(2,1) #从当前位置往后移动两个字节，当前位置为文件开头

2模式详解

with open('a.txt','rb')as f:
    f.seek(0, 2) #参照文件末尾移动0个字节，即直接跳到文件末尾
    f.seek(-3, 2) #参照文件末尾往前移动3个字节

文件的修改

# 实现思路：将文件内容发一次性全部读入内存,然后在内存中修改完毕后再覆盖写回原文件
# 优点: 在文件修改过程中同一份数据只有一份
# 缺点: 会过多地占用内存
with open('b.txt','r', encoding='utf-8')as f:
    data = f.read() #将b.txt中的内容读出来，并定义一个变量对应它
with open('b.txt','w', encoding='utf-8')as f:
    f.write(data.replace('你好','真帅'))#通过字符串的内置方法将文件内的‘你好’替换为‘真帅’
    
    
# 实现思路：以读的方式打开原文件,以写的方式打开一个临时文件,一行行读取原文件内容,修改完后写入临时文件...,删掉原文件,将临时文件重命名原文件名
# 优点: 不会占用过多的内存
# 缺点: 在文件修改过程中同一份数据存了两份
import os
with open('b.txt', 'rt',encoding='utf-8')as read_f,
    open('b_swap.txt', 'wt', encoding='utf-8')as write_f:
    for line in read_f:
        write_f.write(line.replace('阿四','阿三'))
os.remove('b.txt')
os.rename('b_swap.txt', 'b.txt')

查看全文

相关阅读:
Xamarin android PreferenceActivity 实现应用程序首选项设置（一）
xamarin android——数据绑定到控件（四）
xamarin android——数据绑定到控件（三）
xamarin android——数据绑定到控件（二）
xamarin android——数据绑定到控件（一）
Xamarin 实现android gridview 多选
 Entity Framework Code First 迁移数据库
 Linq to sql 接收存储过程返回的多个结果集
 windows phone URI映射
 element row源码

原文地址：https://www.cnblogs.com/a736659557/p/11892338.html