zoukankan      html  css  js  c++  java
  • 文件处理

    一.字符编码中encode和decode

    encode:unicode的二进制------编码encode------->gbk格式的二进制

    decode:unicode的二进制<------解码decode-------gbk格式的二进制

    二.文件的基本知识

    1. 什么是文件
                  文件是操作系统为应用程序或者用户提供一种操作硬盘的虚拟单位
                  强调:
                         文件是操作系统提供的虚拟单位
                         应用程序或者用户对文件的读写操作其实都是向操作系统发送指令

    2. 为何要用文件
                  文件对应的硬盘空间,如果需要考虑永久保存数据那必须使用文件

    3. 如何用文件
           路径问题:
                  绝对路径:在任意位置都可以找到文件
                      win: C:acd.txt 
                      linux: /a/b/c/d.txt
                  相对路径: 相对于当前执行文件所在文件夹
                      a/b/c/d.txt

    三.文件的基本操作

    1 打开文件
                f=open(r'D:脱产5期内容day09a.txt',mode='rt',encoding='utf-8')

                第一个参数:文件路径

                第二个参数:文件的打开模式

                第三个参数:指定文件的编码     

                f=open(...)是由操作系统打开文件,那么如果我们没有为open指定编码,那么打开文件的默认编码很明显是操作系统说了算了,操作系统会用自己的默认编码去打开文件,在windows下是gbk,在linux下是utf-8。 若要保证不乱码,文件以什么方式存的,就要以什么方式打开。

    2 读/写文件
                data=f.read()

                data=f.write()

    3 关闭文件
    f.close() # 向操作系统发送指令,让操作系统关闭打开的文件,回收操作系统资源

    4.上下文管理:用with打开文件,执行完毕后,会自动关闭文件
               with open('a.txt',mode='rt',encoding='utf-8') as f:
                     data=f.read()
                     print(data)

    四.文件的打开模式

    1.控制文件读写操作的模式


    r(默认):只读模式,以该模式打开文件,当文件不存在时则报错,当文件存在时文件指针在文件开头
    with open('a.txt',mode='rt',encoding='utf-8') as f:
    f.read() # 读取所有内容,光标移动到文件末尾
    f.readable() # 文件是否可读
    f.writable() # 文件是否可写
    f.readline() # 读取一行内容,光标移动到下一行开头
    f.readlines() # 读取每一行内容,放到一个列表当中


    w: 只写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时清空文件内容,文件指针在文件开头
    with open('a.txt',mode='wt',encoding='utf-8') as f:
    在打开了文件不关闭的情况下,连续的写入,新写的内容总是跟在老内容之后
    f.write() # 把所有内容都写进文件中
    f.writelines(lines) # 相当于执行一个for循环,把每一个内容,都写进文件中
    a: 只追加写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时不清空文件内容,文件指针跳到文件末尾
    with open('c.txt',mode='at',encoding='utf-8') as f:
    f.write()
    f.writelines()


    2.控制文件读写内容的模式(不能单独使用,必须与r、w、a连用)


    t(默认):无论读写都是以字符为单位的,只能操作文本文件,必须指定encoding参数
    b:无论读写都是以bytes为单位的,可以操作所有文件,一定不能指定encoding参数

    3.了解:
           +(可以同时读写文件):不能单独使用,必须与r、w、a连用,r+ w+ a+
           控制文件内指针移动:f.seek(10),其中的数字代表的字节数

    五.修改文件的两种方式

    方式一:
    1. 以读的方式打开源文件
    2. 将文件内容一次性全读入内存,在内存完成修改
    3. 以写的方式打开源文件,然后将修改后的结果一次性写入源文件
    总结:
    优点:在文件修改过程中硬盘只存在一份数据
    缺点:浪费内存

    with open('b.txt',mode='rt',encoding='utf-8') as f1:
        msg=f1.read()
        new_msg=msg.replace('alex','大SB')

    with open('b.txt',mode='wt',encoding='utf-8') as f2:
    f2.write(new_msg)

    方式二:
    1. 以读的方式打开源文件,以写的方式打开一个临时文件
    2. 读取源文件的一行内容到内存中,将修改的结果写入临时文件,循环往复直到改
    3. 删除源文件,将临时文件重命名为源文件名
    优点:同一时间在内存中只有文件的一行内容,更节省内容
    缺点:在文件修改过程中硬盘只存在两份数据

    import os

    with open('b.txt',mode='rt',encoding='utf-8') as read_f,open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f:
        for line in read_f:
        write_f.write(line.replace('大SB','alex'))

    os.remove('b.txt')
    os.rename('.b.txt.swap','b.txt')

  • 相关阅读:
    如何通过命令行窗口查看sqlite数据库文件
    eclipse自动补全的设置
    文本装饰
    注释和特殊符号
    文本装饰
    网页背景
    通过ArcGIS Server admin 查看和删除已注册的 Web Adaptor
    通过 ArcGIS Server Manager 查看已安装的 Web Adaptor
    通过 ArcGIS Server Manager 验证 DataStore
    Windows上安装ArcGIS Enterprise——以 Windows Server 2012 R2上安装 ArcGIS 10.8为例
  • 原文地址:https://www.cnblogs.com/wangke0917/p/10022290.html
Copyright © 2011-2022 走看看