zoukankan html css js c++ java

Python-18-文件处理

文件处理流程：
1、打开文件，得到文件句柄并赋值给一个变量
2、通过句柄对文件进行操作
3、关闭文件

# Example 1

# f = open('a',encoding='utf-8')          # 打开文件，得到文件句柄并赋值给一个变量
# data = f.read()                          # 通过句柄对文件进行操作
# print(data)
# f.close()                                # 关闭文件

##################### 打开文件的模式 ##################
默认为文本模式，只能是字符串（文件没有修改一说，全是覆盖！！）
r -- 只读模式【默认模式；文件必须存在，不存在则抛出异常】
w -- 只写模式【不可读；不存在则创建；存在则清空内容】
a -- 只追加写模式【不可读；不存在则创建；存在则只追加内容】
x -- 只写模式【不可读；不存在则创建；存在则报错】（不常用，没什么用）
##################### 打开文件的模式 ##################
对于非文本文件，我们只能使用b模式，"b"表示以字节的方式操作（而所有文件也都是以字节的形式存储的，
使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式）
rb wb ab
以b方式打开时，读取到的内容是字节类型，写入时也需要提供字节类型，不能指定编码
##################### 打开文件的模式 ##################
"+"  表示可以同时读写某个文件
r+， 读写【可读，可写】
w+， 写读【可读，可写】
a+， 写读【可读，可写】
##################### 打开文件的模式 ##################

# 1、r -- 只读模式

# f = open('a','r',encoding='utf-8')      # 默认打开模式就为 r
# data = f.read()                          # 读取文件全部，如果这里读取了，下面再出现readline 就没有文件读取了。
# print(data)
# print(f.readable())                       # 结果：True  判断当前文件是否是-只读（r）
# print(f.readline())                       # 读取文件 第一行 （一次读一行）
# print(f.readline(),end="")                # 读取文件 第二行 并且第二行、第三行之间没有 另隔一行 换行
# print(f.readline())                       # 读取文件 第三行

# data = f.readlines()                        # 将文件所有行，按列表的形式输出
# print(data)

# f.close()


# 2、w -- 只写模式

# 写模式--如果文件不存在，新建一个文件；如果文件存在，会把该文件清空（==新建一个空文件，覆盖原文件）
# f = open('a1','w',encoding='utf-8')
# f.write("newmet.top == 初相识 01
")
# f.write("newmet.top == 初相识 02
")
# f.write("new
met.top
初相识 03
")
# print(f.writable())              # 结果：True  判断当前文件是否是-只写（w）
# f.writelines(['111
','222
','333
'])
#
# f.close()

# 3、a -- 只追加写模式

# f = open('a1','a',encoding='utf-8')
# f.write("写到文件最后")               # 类似 日志访问记录，自动追加到文件最后
# f.close()


# 4、f.close 可以不写，利用with关键字去只写、只读文件：

# 1）打开一个文件：
with open('a1','w',encoding='utf-8') as f:
    f.write("newmet.top
初相识
")

# 2）同时打开两个文件：
with open('a','r',encoding='utf-8') as src_f,
        open('a1','w',encoding='utf-8') as dst_f:              # 同一行代码太长，加 enter 换行
    data = src_f.read()
    dst_f.write(data)

##################### 文件的修改 ##################

# 1、文件取出来、修改

src_f = open('文件修改','r',encoding='utf-8')
data1 = src_f.readlines()      # 列表
src_f.close()

dst_f = open("文件修改-01","w",encoding="utf-8")
# f2.writelines(data1)
dst_f.write(data1[0])
dst_f.close()

# 2、文件覆盖

src_f = open('文件修改','r',encoding='utf-8')
data1 = src_f.readlines()      # 列表
src_f.close()

dst_f = open("文件修改","w",encoding="utf-8")
# f2.writelines(data1)
dst_f.write(data1[0])
dst_f.close()


# 上面1、2合并在一起：
with open('文件修改','r',encoding='utf-8') as src_f,
        open('文件修改-01','w',encoding='utf-8') as dst_f:              # 同一行代码太长，加 enter 换行
    data = src_f.read()
    dst_f.write(data)

##################### b模式 ##################

f = open('a1','rb')             # b模式不能指定编码
data = f.read()
print(data)                     # 二进制
print(data.decode('utf-8'))    # 字符串
f.close()


f = open('a1','wb')             # b模式不能指定编码
f.write(bytes('newmet
',encoding='utf-8'))    # 编码
f.write('初相识'.encode('utf-8'))               # 编码
f.close()

f = open('a1','ab')             # b模式不能指定编码
f.write('初相识'.encode('utf-8'))               # 编码
f.close()

##################### 文件处理的其他方法 ##################

f=open('a1','r+',encoding='utf-8')
f.read()            #读取所有内容,光标移动到文件末尾
f.readline()        #读取一行内容,光标移动到第二行首部
f.readlines()       #读取每一行内容,存放于列表中
print(f.encoding)   # 输出 读取时文件使用的编码
f.flush()           # 刷新 保存
print(f.name)       # 打印文件名

f=open('a1','r+',encoding='utf-8',newline='')   # 读取文件中真正的换行符号（
）

# 光标的移动
# 一: read(3)：
# 　　1. 文件打开方式为文本模式时，代表读取3个字符
# 　　2. 文件打开方式为b模式时，代表读取3个字节
# 二: 其余的文件内光标移动都是以字节为单位如seek，tell，truncate

print(f.tell())     # 定位光标位置
f.readline()
print(f.tell())
f.seek(10)
print(f.tell())

data=f.truncate(10)         # 截取从开始一直到第10个 部分
print(data)

############   seek 0、1、2   ##########

# 1、f.seek(3,0)
# 0 可写可不写，代表从开头位置算起
f=open('seek.txt','r',encoding='utf-8')
print(f.tell())           # 0
f.seek(10)
print(f.tell())           # 10
f.seek(3)
print(f.tell())           # 3

# 2、f.seek(3,1)
# 1 代表相对位置，从上一次光标所在位置算起
# 相对位置，只能是b模式，而且不能有encoding编码
f=open('seek.txt','rb')
print(f.tell())         # 0
f.seek(10,1)            # 10
print(f.tell())
f.seek(3,1)
print(f.tell())         # 13

# 3、f.seek(3,2)
# 2 代表相对位置，从末尾光标所在位置算起
# 相对位置，只能是b模式，而且不能有encoding编码
f=open('seek.txt','rb')
print(f.tell())
f.seek(-10,2)
print(f.read())         # 结果：b'2
newmet3'

############   seek 0、1、2   ##########

# 看日志最后一行内容：

# 1、基础方法：
f=open('日志文件','rb')
data=f.readlines()
print(data[-1].decode('utf-8'))

# 2、seek方法：

# 看日志最后一行内容：
f=open('日志文件','rb')
for i in f:             # 循环文件的推荐方式  要一行给一行
    offs = -3           # 定义一个偏移量
    while True:
        f.seek(offs,2)
        data=f.readlines()
        if len(data)>1:
            print('最后一行：%s'%(data[-1].decode('utf-8')))
            break
        offs*=2
# 倒序阅读，逐渐增加偏移量

查看全文

相关阅读:
websocket的理解&应用&场景
 如何设置winform程序图标
 Python简单爬虫爬取自己博客园所有文章
 分享一个自己做的SpringMVC的PPT
2016校招薪资汇总
 2016阿里巴巴校招offer面经
 利用快排partition求前N小的元素
 几个面试经典算法题Java解答
 深入理解java垃圾回收机制
 深入理解JVM结构

原文地址：https://www.cnblogs.com/newmet/p/10037201.html