转自 http://www.cnblogs.com/BeginMan/p/3166644.html
一、文件对象
我理解的文件对象就是一个接口,通过这个接口对文件进行相关操作。
《Python 核心编程》上说的很晦涩,这里没有深刻理解到,希望有人能解释给我听。
>>> f = open('demo.txt','r') >>> f <open file 'demo.txt', mode 'r' at 0x00CCCEC0> >>> type(f) <type 'file'>
二、相关函数
[1]、内建函数:open()
提供了初始化输入/输出(I/O)操作的通用接口,成功打开一个文件后会返回一个文件对象,否则发生IOError异常。语法如下:
file_object = open(file_name,access_mode = 'r',buffering = -1)
分析如下:
1):file_name:表示要打开文件名字的字符串,可以是相对路径也可以是绝对路径。
如:我在D盘新建一个空白名为out的文本文件,然后进行相关操作。
>>> f = open('../out.txt','w') >>> f.write('good') >>> f.close()
则打开该文件后,发现'good'已经写入进去了。
接下来使用绝对路径进行访问,如下:
>>> f = open('D:/out.txt','r') >>> f.read() 'good' >>> f.close()
2、可选变量access_mode也是字符串,代表文件打开模式。
注意:
1):使用'r'或'U'模式打开的文件必须已经存在
2):'w'模式打开的文件若存在则先清空,然后重新创建
3):'a'模式打开的文件是为了追加数据做准备的,所有写入的数据将追加到文件末尾。如果文件不存在,则自动被创建。
4):'+'代表可读可写
5):'b'代表二进制模式访问
6):默认情况下是 'r'
3、buffering可选参数,用于指示访问文件所采用的缓存方式。0表示不缓存;1表示只缓存一行,n代表缓存n行。如果不提供或为负数,则代表使用系统默认的缓存机制。
用处?这个麻烦有人能告诉我!
关闭文件:
打开文件消耗系统资源, 并且依赖于文件模式, 其它程序或许不能访问它们。这就是一旦操作完毕就该关闭文件的重要所在。
接上面的操作,加入还没有关闭:
>>> f.closed #判断是否关闭 False >>> f.close() #关闭方法 >>> f.closed True >>> f.tell() #如果已关闭,则一切针对文件操作都无效 Traceback (most recent call last): File "<pyshell#27>", line 1, in <module> f.tell() ValueError: I/O operation on closed file >>>
[2]、工厂函数file()
与open()一样,可相互替换
>>> f = file('../out.txt','r') >>> f.read() 'good' >>> f.close()
三、相关方法
返回一个文件对象后(句柄),其实我也不清楚到底什么是句柄,这里摘自百度百科:
句柄,是整个windows编程的基础。一个句柄是指使用的一个唯一的整数值,即一个四字节长的数值,来标志应用程序中的不同对象和同类对象中的不同的实 例,诸如,一个窗口,按钮,图标,滚动条,输出设备,控件或者文件等。应用程序能够通过句柄访问相应的对象的信息,但是句柄不是一个指针,程序不能利用句柄来直接阅读文件中的信息。如果句柄不用在I/O文件中,它是毫无用处的。 句柄是windows用来标志应用程序中建立的或是使用的唯一整数,windows使用了大量的句柄来标志很多对象。
一般与文件相关的方法无非是:输入、输出、文件内移动、杂项
[1]、输入
1、read():读取字节到字符串中,有可选参数size,默认是-1,如果为-1或复数则文件将会被读取到文件末尾。
>>> f.read() 'good' >>> f.read(2) 'go'
2、readline():读取文件的一行,包括行结束符。同read()也有个可选参数size。
3、readlines():读取所有(剩余的)然后将它们作为字符串列表返回,它有个可选参数sizhint代表返回的最大字大小。
>>> f = file('../out.txt','r') >>> f.readlines() ['good']
[2]、输出
1、write():把含有文本数据或二进制数据块的字符串写入到文件中去。
2、writelines():针对列表操作,接受一个字符串列表作为参数,将它们写入文件,行结束符并不会被自动加入,如果需要的话必须在调用writelines方法前给每一行结尾加上结束符。
>>> f = open('d:/out.txt','w') >>> f.writelines(['man']) >>> f.close() >>> f = open('d:/out.txt','r') >>> f.read() 'man'
【注意:】
当使用read()或者readlines()从文件中读取行时,Python并不会删除行结束符,这个操作留给了程序员。
>>> f.readlines() ['game is your life,game is your life,game is your life,game is your life,game is your life,[*] ', 'game is your life,game is your life,game is your life[]'] --------------------------- >>> f = open('demo.txt','r') >>> data = [line.strip() for line in f.readlines()] >>> data ['game is your life,game is your life,game is your life,game is your life,game is your life,[*]', 'game is your life,game is your life,game is your life[]']
类似的,write()和writelines()也不会自动加入行结束符,应该自己添加。
>>> f = open('demo.txt','w') >>> f.writelines([' my name is BeginMan ,I like coding']) >>> f.close()
打开该文件可查看:
[3]、文件内移动
tell()、seek()方法
f = open('d:/out.txt','rb') print f.tell() #[1] f.seek(10,1) #[2] print f.tell() #10 print f.read(10) # BeginMan, print f.read(18) #I like coding. print f.tell() #38 """ 【1】:tell(): tell 方法确认了已经移到当前文件位置 一个文件对象维护它所打开文件的状态。文件对象的 tell 方法告诉你在打开文件中的当前位置。 因为我们还没有对这个文件做任何事,当前位置为 0,它是文件的开始处。 """ """ 【2】:seek(): 文件对象的 seek 方法在打开文件中移动到另一个位置。第二个参数指出第一个参数是什么意思: 0 表示移动到一个绝对位置 (从文件开始算起), 1 表示移到一个相对位置 (从当前位置算起), 还有 2 表示文件末尾 """
[4]、文件迭代
>>> f = open('d:/out.txt','rb') >>> for eachline in f: eachline 'my name is BeginMan, ' 'I like coding. '
四、相关属性
file.closed:文件已被关闭,否则为False
file.mode:文件访问模式
file.name:文件名称
>>> f.mode 'r' >>> f.name 'demo.txt'