zoukankan html css js c++ java

python 文件操作之指针v1

python 文件操作之指针

python 文件操作之指针

一：文件内指针移动的单位是什么？

1：t模式

从硬盘中读出二进制===>解码的到字符串====>你好呀hello word
只有t模式下,read(n),n是字符个数
with open('a.txt', mode='rt',encoding='utf-8') as f:
    data = f.read(6)
    print(f.tell())  # 12
print(data) # 你好呀hel

2：b模式

b模式下read(n),n是多少个二进制数byte
8bit=>1Byte
1024Byte = 1KB
1024KB=1MB
1024MB=1GB
1024GB=1TB
1GB=1024*1024*8
with open('a.txt',mode='rb') as f:
    data =f.read(6)
    print(f.tell())  # 6
print(data.decode('utf-8'))  # 你好

以b模式读取文件内容
with open('a.txt', mode='rb') as f:
    data = f.read(9)  # 在utf-8编码保存文件一个中文字符占3个byte
    print(type(data))
    print(len(data))
    print(data.decode('utf-8'))

b.txt 文件是以gbk编码保存的文件，底层存的是二进制
gbk编码中文占连个byte
with open('b.txt', mode='rb') as f:  # hello你好
    data = f.read(7)
    print(type(data))
    print(len(data))
print(data.decode('utf-8')) # 报错 你以gbk编码写入文件的，同样都出来，也是gbk编码读出来
print(data.decode('gbk'))

3：指针操作

一 主动/单独地控制文件指针移动
f.seek(x,y)
x代表移动的字节个数
y代表模式(0,1,2)b
0:代表指针参照物是文件开头，可以在t模式和b模式下使用
b.txt是以utf-8编码存储到文件中
with open('b.txt', mode='rt', encoding='utf-8') as f:  # 从删库到跑路
    data = f.read(2)
    print(data)  # 从删
    print(f.tell()) # 6

1：代表的是当前位置，只能在b模式下用
c.txt他是utf-8编码存的
with open('c.txt',mode='rb') as f:  # 你好word
    f.read(1)
    print(f.tell())  # 1
    f.seek(2, 1)
    print(f.tell())  # 3
    print(f.read().decode('utf-8'))  # 好word

2：代表的是参照物在文件末尾，只能以b模式下用
with open('d.txt', mode='rb') as f:  # 你好word真难
    f.seek(250, 2)
    print(f.tell())  # 16+250=266
    f.seek(-3, 2)
    print(f.tell())  # 13
    f.seek(0, 2)    # 快速将指针移动到文件末尾(可以用a模式打开也一样
    print(f.tell())  # 16

3：开发类似与tail -f

import time

with open(r'D:s9day10acess.log', mode='rb') as f:
    f.seek(0, 2)
    while True:
        line = f.readline()
        if len(line) == 0:
            time.sleep(1)
        else:
            print(line.decode('utf-8'),end='')

日志生成器
import time
with open(r'D:s9day10acess.log', mode='at', encoding='utf-8') as f:
    f.write('%s 你这个程序是死循环
' % (time.strftime('%Y-%m-%d %H:%M:%m')))

4:文件复制

文件修改
文件修改都是模拟出来的，实现修改需要借助内存
硬盘数据没有修改的说法，都是用新内容覆盖旧的内容
有两种方式
方式一
    1：硬盘中的内容全部读入内存，
    2：把内存中的数据一次性修改完毕
    3：把内存中修改完成的结果覆盖会原文件
with open('f.txt', mode='rb') as f_read:  # 你好word真难
    data = f_read.read().decode('utf-8')
    res = data.replace('word', '世界')
    print(res)

with open('f.txt', mode='wb') as f_write:
    f_write.write(res.encode('utf-8'))
缺点：浪费内存，有可能文件过大，撑爆内存
优点：不费硬盘空间，数据只存一份


方式二
    1：把硬盘内容全部读入内存
    2：在内存中把内容一次性修改完毕，临时存储到硬盘中
    3：让后把临时文件重新命名，源文件删除掉

import os
with open('f.txt', mode='rt',encoding='utf-8') as read_f,
        open(".f.txt.swap",mode='wt',encoding='utf-8') as write_f:  # 你好世界真难
    for line in read_f:
        write_f.write(line.replace("word",'世界'))

os.remove('f.txt')
os.rename('.f.txt.swap', 'f.txt')
优点：省内存空间，内存同一时刻只有文件的一行内容
缺点：浪费硬盘文件，在修改过程中会存放两份数据

查看全文

相关阅读:
什么是Java
程序有问题解决方法
 面向对象三大特征
 实例变量和局部变量
 内存管理
 常见面试题（更新中）
多态
 设计规则
 内部类
 编程英语

原文地址：https://www.cnblogs.com/wait59/p/13100058.html