python基础-文件操作

zoukankan html css js c++ java

python基础-文件操作
一、介绍　

　　计算机系统分为：计算机硬件，操作系统，应用程序三部分。

　　我们用python或其他语言编写的应用程序若想要把数据永久保存下来，必须要保存于硬盘中，这就涉及到应用程序要操作硬件，众所周知，应用程序是无法直接操作硬件的，这就用到了操作系统。

　　操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用，其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念，用户或应用程序通过操作文件，可以将自己的数据永久保存下来。

　　有了文件的概念，我们无需再去考虑操作硬盘的细节，只需要关注操作文件的流程：
```
　　#1. 打开文件，得到文件句柄并赋值给一个变量
　　#2. 通过句柄对文件进行操作
　　#3. 关闭文件　　

二、在python中
  1.打开文件，得到文件的一个句柄并赋值给一个变量:
　　f = open('info.txt','r',encoding='utf-8') 默认打开模式r,执行模式是t、
　2.通过句柄对文件进行操作
　　f.read()
　3.关闭资源
　　f.close()
　　
三、f=open()的过程分析
　
　1.由应用程序向操作系统发起系统调用 open
　2.操作系统打开文件，并返回一个文件句柄给应用程序    
　3.应用程序将文件句柄赋值给变量f

四、强调
```
　　打开一个文件包含两部分资源：操作系统级打开的文件+应用程序的变量。在操作完毕一个文件时，必须把与该文件的这两部分资源一个不落地回收，回收方法为：
　　1、f.close() #回收操作系统级打开的文件
　　2、del f #回收应用程序级的变量

　　其中del f一定要发生在f.close()之后，否则就会导致操作系统打开的文件还没有关闭，白白占用资源，
　　而python自动的垃圾回收机制决定了我们无需考虑del f，这就要求我们，在操作完毕文件后，一定要记住f.close()

　　虽然我这么说，但是很多同学还是会很不要脸地忘记f.close(),对于这些不长脑子的同学，我们推荐傻瓜式操作方式：使用with关键字来帮我们管理上下文
　　with open('a.txt','w') as f:
　　　　pass

　　with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
　　　　data=read_f.read()
　　write_f.write(data)

　　强调第二点：

　　f=open(...)是由操作系统打开文件，那么如果我们没有为open指定编码，那么打开文件的默认编码很明显是操作系统说了算了，操作系统会用自己的默认编码去打开文件，

　　在windows下是gbk，在linux下是utf-8。
```
　若要保证不乱码，文件以什么方式存的，就要以什么方式打开。
　f=open('a.txt','r',encoding='utf-8')
```
　五、文件的模式

　　#1. 打开文件的模式有(默认为文本模式)：
　　r ，只读模式【默认模式，文件必须存在，不存在则抛出异常】
　　w，只写模式【不可读；不存在则创建；存在则清空内容】
　　a，之追加写模式【不可读；不存在则创建；存在则只追加内容】

　　#2. 对于非文本文件，我们只能使用b模式，"b"表示以字节的方式操作

　　（而所有文件也都是以字节的形式存储的，使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式）
　　rb
　　wb
　　ab
　　注：以b方式打开时，读取到的内容是字节类型，写入时也需要提供字节类型，不能指定编码

　　#3. 了解部分
　　"+" 表示可以同时读写某个文件
　　r+，读写【可读，可写】
　　w+，写读【可读，可写】
　　a+，写读【可读，可写】

　　x，只写模式【不可读；不存在则创建，存在则报错】
　　x+ ，写读【可读，可写】
　　xb
```
六、文件的常用方法：
　
```
　　#掌握
　　f.read() #读取所有内容,光标移动到文件末尾
　　f.readline() #读取一行内容,光标移动到第二行首部
　　f.readlines() #读取每一行内容,存放于列表中

　　f.write('1111 222 ') #针对文本模式的写,需要自己写换行符
　　f.write('1111 222 '.encode('utf-8')) #针对b模式的写,需要自己写换行符
　　f.writelines(['333 ','444 ']) #文件模式
　　f.writelines([bytes('333 ',encoding='utf-8'),'444 '.encode('utf-8')]) #b模式

　　#了解
　　f.readable() #文件是否可读
　　f.writable() #文件是否可读
　　f.closed #文件是否关闭
　　f.encoding #如果文件打开模式为b,则没有该属性
　　f.flush() #立刻将文件内容从内存刷到硬盘
　　f.name

七、文件内指针操作:

　　f.seek()移动指针: 第一个参数：控制移动的单位，统一就是字节

　　　　　　　　　　第二个参数：控制移动的参照物。

　　　　　　　　　　　0：参照文件开头（默认）

　　　　　　　　　　　1：参照当前位置只能用在b模式

　　　　　　　　　　　2：参照文件末尾只能用在b模式

　　　　　注意：1个中文字符对应3个字节

　　　　　　　　f.read() 在　t模式下读的是字符个数

　　　　　　　　　　　在 b模式下读的是字节个数

　　　　　　　　

　　 f.tell() 查询当前指针所在位置的字节个数, 以字节为单位

　　　f.turncate 从文件开头，截断n个字节后的数据,其余数据删除

　　　　　　　参数：所在第n个字节

　八、文件修改

　　注意：硬盘没有改这一说，只有覆盖.内存可以修改

　　文本编辑器之类的工具修改文件的原理：

　　　优点：在修改期间同一硬盘只有一个文件

　　　缺点：占用内存过高

　　　　1.先将文件内容从硬盘全部读入到内存

　　　　2.在内存中修改完毕

　　　　3.将修改后的文件写回覆盖到内存

　　　　

　　　

　　　一行一行的读，一行一行的改：

　　　优点：同一时刻在内存中只存在文件的一行内容

　　　缺点：在修改期间，硬盘上同一份数据保存两份

　　　　1.以读的模式打开源文件，以写的模式打开另一个临时文件

　　　　2.然后用for循环读取原文件一行行内容，每读一行则修改一行，将修改的结果写入临时文件，直到把源文件都遍历完

　　　　3.删除原文件，将临时文件重命名为源文件

　　　　
```
　　　　
　　
```
查看全文

相关阅读:
Electron-Builder 打包Nsis，安装后自动运行程序
 依赖倒置原则（DIP）、控制反转（IoC）、依赖注入（DI）（C#）
六大设计原则（C#）
C#简单爬取数据（.NET使用HTML解析器NSoup和正则两种方式匹配数据）
简单架构：反射实现抽象工厂+IDAL接口完全独立DAL
C#高级语法之泛型、泛型约束，类型安全、逆变和协变（思想原理）
委托和lambda表达式，Action和Func
.NET中使用WebService，以及和一般处理程序、类库的区别
 C#原型模式（深拷贝、浅拷贝）
Thread、ThreadPool、Task、Parallel的基本用法、区别以及弊端

原文地址：https://www.cnblogs.com/linbin7/p/10503879.html