zoukankan      html  css  js  c++  java
  • python基础-文件处理

    文件处理

    文件三大疑问:什么是文件?为什么要用文件?怎么用文件?

    • 文件(文件系统)是操作系统提供给我们操作硬盘的一个工具
    • 使用文件系统是为了永久地保存数据

    文件的操作方式

    • 相对路径和绝对路径

      • 相对路径:从当前路径开始,相对与某个基准目录的路径
      • 绝对路径:从根目录也就是盘符开始的路径

      在编程中,建议使用相对路径

    • 操作文件的两种方法

      • open

        语法:f = open('文件名路径',mode,encoding) ,用于打开文件。

        文件路径:建议使用相对路径

        mode:打开文件的模式,有三种,分别是:rwa。一般和处理文件的两个模式套用。

        处理文件的两种模式是:tb

        encoding:打开文件,操作文件内容的编码设置

        # 第一种打开方式,这种打开方式,必须使用f.close()来关闭系统资源
        f = open("a.txt","r",encoding="utf-8")
        data = f.read()     # 读取a.txt 文件中的全部内容
        print(data)         # 打印文件中的内容
        f.close()           # 关闭操作系统资源
        
        模式 描述 特点
        rt 默认模式,可简写为 r。以文本文件且只读的模式打开文件 如果文件不存在,报错
        wt 可简写为 w。以文本文件且只写模式打开文件 如果文件不存在,创建一个新文件;如果文件中存在数据,重写文件中的内容
        at 可简写为 a,以文本文件且只写模式打开文件 如果文件不存在,创建一个新文件;如果文件中存在数据,在数据后追加内容
        rb 二进制字符且只读的模式打开文件 如果文件不存在,报错
        wb 二进制字符且只写的模式打开文件 如果文件不存在,创建一个新文件;如果文件中存在数据,重写文件中的内容
        ab 二进制字符且只写的模式打开文件 如果文件不存在,创建一个新文件;如果文件中存在数据,在数据后追加内容
      • with open() as …:

        语法:with open("文件名路径",mode,encoding)as f:建议使用这种方式对文件进行操作,上下文关联打开文件。优点:不仅会自动回收系统资源,且可以同时打开多模式下的同一文件或多个文件。

        # 第二种打开方式,上下文关联方式,会自动关闭系统资源,建议使用这种方式
        with open("a.txt","r",encoding="utf-8") as f:
            data = f.read()
            print(data)
            
        # 同时打开多个文件,用逗号分隔开
        with open("a.txt","r",encoding="utf-8")as rf,
        	open("b.txt","w",encoding="utf-8") as wf:
            data = f.read()
            wf.write(data)
        
    • 文件处理的内置方法

      # a.txt 文件中的内容
      姓名:sean
      年龄:18
      性别:男
      描述:上海校区最帅的人
      
      • 语法 说明
        f.read() 默认一次性读取出所有的文件内容;参数根据mode的模式,如果是 t,读取文件的字符个数;如果是 b,读取文件的字节数
        f.readline() 一次只能读取一行内容
        f.readlines() 将数据全部读入内存中,以换行符分隔存入列表中
        f.readable() 判断文件是否可读,返回布尔值
        # 模式为:只读文本模式,r=rt 是read text
        with open("a.txt","r",encoding="utf-8") as f:
            print(f.readable())		# 打印结果为:True
            print(f.readline())     # 打印结果为:姓名:sean
            print(f.readlines())    # 打印结果为:列表['年龄:18
        ', '性别:男
        ', '描述:上海校区最自恋的人']
            f.seek(0,0)             # 将光标移动到文件的开始
            print(f.read())			# 打印结果为:所有的内容
        
        # 模式为:只读字节模式,rb 是read bytes。注意:使用字节模式,encoding参数不可用
        with open("c.txt","rb") as f:
            print(f"readable的结果:{f.readable()}")     # 打印结果:True
            print(f"read的结果:{f.read()}")         # 打印结果:文件所有内容的二进制字节
            f.seek(0,0)             # 将光标移动到文件的开始
            print(f"readline的结果:{f.readline()}")     # 打印结果:文件内容第一行记录的二进制字节
            f.seek(0,0)
            print(f"readline的结果:{f.readlines()}")    # 打印结果:列表形式的二进制字节
        

        打印结果:

      • 语法 说明
        f.write() 将数据写入文件
        f.writelines 可迭代对象的元素以字符串形式写入文件。等价于for+write()
        f.writeable 判断文件是否可写,返回布尔值
        # 只写文本模式,将文件中的原内容清空,重写了新的内容
        with open(r"a.txt","w",encoding="utf-8") as wf:
            print(f"是否可读:{wf.readable()}")		
            print(f"是否可写:{wf.writable()}")
            wf.write("这是使用write新写入的内容
        ")
            wf.writelines(["这是使用writelines新写入的内容1
        ","这是使用writelines新写入的内容2
        ","这是使用writelines新写入的内容3
        "]) 		# 列表中的内容会拼接起来写入文件中
        
        # 验证是否将内容写入到a.txt 文件中
        with open(r"a.txt","r",encoding="utf-8") as  rf:
            print(rf.read())
        

        操作结果

        # 追加文本模式,保留文件中原来的内容,并在后面追加新的数据
        with open(r"a.txt","a",encoding="utf-8") as af:
            print(f"是否可读:{af.readable()}")
            print(f"是否可写:{af.writable()}")
            af.write("这是使用追加模式write写入的内容
        ")
            af.writelines(["这是使用追加模式writelines新写入的内容1
        ","这是使用追加模式writelines新写入的内容2
        ","这是使用追加模式writelines新写入的内容3
        "])
        # 验证是否将内容写入到a.txt 文件中
        with open(r"a.txt","r",encoding="utf-8") as  rf:
            print(rf.read())
        

        操作结果

        1573219631390

      • 光标(指针)的操作

        语法 描述
        f.seek(offset,whence) offsetf:相对偏移度,也就是光标移动的位数,针对的是字节
        whence:用于指定光标位置从哪里开始。
        值只能是:0(文件开头),1(当前位置),2(文件末尾)。
        f.tell() 光标所在的位置
    • 注意:

      • utf-8 中,中文字符占3bytes,英文字符占1bytes
      • gbk 中,中文字符占2bytes,英文字符占1bytes
      • 操作文件时,一定要注意编码规则问题,谨记保证不乱码的核心:用什么编码存的数据,就用什么编码取

    扩展

    我们学习的读取文件 rwa 是纯净模式,还有 r+w+a+模式。这三种模式设置成了可读可写模式,其他特性跟纯净模式是一样的。

  • 相关阅读:
    Redis认识
    常见注解和LambdaQueryWrapper
    微信开发思路和一些文档
    安全框架
    学习:Token
    javascript中对象的创建-原型模式1
    开发常用工具
    【java爬虫--1】Htmlunit+Jsoup解析非静态页面爬取图片
    【java爬虫--2】将批量图片地址转成pdf文件
    文本文件按行去重,有序输出
  • 原文地址:https://www.cnblogs.com/xiaodan1040/p/11824139.html
Copyright © 2011-2022 走看看