zoukankan      html  css  js  c++  java
  • python学习day9 字符编码和文件处理

    1.字符编码

    x='上'

    #unicode的二进制---------》编码--------》gbk格式的二进制

    res=x.encode('gbk') #bytes 字节类型

    print(res,type(res))

    m=res.decode('gbk') 

    print(m)  #把gbk解码成unicode,python打印自动转换成字符

    2.文件处理

      1.什么是文件

      文件是操作系统为应用程序或者用户提供一种操作硬盘的虚拟单位

      强调:

        文件是操作系统提供的虚拟单位

        应用程序或者用户对文件的读写操作其实都是向操作系统发送指令

      2.为何要用文件

        文件对应的硬盘空间,如果需要考虑永久保存数据那必须使用文件

      3.如何用文件

       路径问题

        绝对路径 优点:无论从哪里运行,都能找到文件

            缺点:比较冗长

        win: c:acd.txt

        linux: /a/b/c/d.txt

        相对路径:相当于当前执行文件所在文件夹 优点:比较简洁

                           缺点:必须在执行文件夹中才能找到文件

        a/b/c/d.txt

        (1)打开文件

        f=open(r'D:abcde.txt',mode='rt',encoding='utf-8') 以utf-8字符编码表解码保存在硬盘中的文件打开到内存中。python应用程序会申请内存空间,存放f,另外会向操作系统发出申请,将文件读取进内存,f返回一个文件句柄

        print(f)

        (2)读/写文件

          data=f.read() # 一次性把文件全部读出

          print (data)

        (3)关闭文件

        f.close() # 向操作系统发送指令,让操作系统关闭打开的文件,回收操作系统资源

        print(f)

        f.read

        上下文管理

        with open('a.txt',mode='rt',encoding='utf-8') as f: #结束使用文件后,会自动关闭文件

          data=f.read()

          print(data)

    3.文件的打开模式

    基本介绍

    控制文件读写操作的模式

    r(默认)

    w

    a

    控制文件读写内容的模式(不能单独使用,必须与r,w,a连用)

    t

    b

    详细介绍

    控制文件读写操作的模式

    r(默认):只读模式,以该模式打开文件,当文件不存在时则报错,当文件存在时文件指针在文件开头

    with open('a.txt',mode='rt',encoding='utf-8') as f:

      data=f.read()

      print(f.readable()) #True

      print(f.writable()) #False

      line=f.readline()

      print(line,end='')

      print(data,type(data))

      for line in f:

        print(line)

      print(f.readlines())# 逐行读入内容,保存成列表文件,每行保存成一个元素

    w:只写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时清空文件内容,文件指针在文件开头

       with open('a.txt',mode='wt,encoding='utf-8') as f:

        print(f.readable()) # False

        print(f.writable)  # True

      在打开了文件不关闭的情况下,连续的写入,新写的内容总是跟在老内容之后

      f.write('abc ')

      lines=['aaaa ','2222 ','3333 ']

      for line in lines:

        f.write(line) 列表的元素一个一个的写入到文件中

      f.writelines(lines)

      f.write('aaaa bbb ccc ')

    a:只追加写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时不清空文件内容,文件指针跳到文件末尾

    with open('c.txt',mode='at',encoding='utf-8') as f:

      f.write('你好 ')

      f.write('dadad ')

      f.writelines([1,2,3]) # 会报错,整型不能加在str后面

    控制文件读写内容的模式(不能单独使用,必须与r,w,a连用)

    t(默认):无论读写都是以字符为单位的,只能操作文本文件,必须指定encoding参数

    b:无论读写都是以字符为单位的,可以操作所有文件,一定不能指定encoding参数

    with open('a.txt',mode='rb') as f:

      data=f.read()

      print(data,type(data))# 直接输出硬盘中保存的二进制数

      print(data.decode('utd-8'))# 把二进制按照utf-8编码表解码成unicode,打印内存中unicode直接解码成字符

    with open('01.mp4',mode='rb') as f:

       data=f.read()

      print(data,type(data)) 

    with open('a.txt',mode='wb') as f: # 直接读取二进制

      f.write('字符打哈收到空间阿斯顿'.encode('utf-8')) 把字符对应的unicode编码成utf-8二进制写入文件

      拷贝文件小程序

      inp_path=input('请输入要打开的文件路径:').strip()

      inp_path1=input('请输入要写入的文件路径').strip()

      with open(inp_path,mode='rb') as read_f

        open(inp_path,mode='wb') as write_f:

        data = read_f.read()

        write_f.write(data)

    了解

    +:不能单独使用,必须与rwa连用 r+,w+,a+

    with open('a.txt','r+t',encoding='utf-8') as f:

      print(f.readable())  可读

      print(f.writable())  也可写

      data=f.reanline()  单独读一行内容,默认从开头读

      print(data)

      f.write('六子') 写在文件最后

    # with open('a.txt','r+t',encoding='utf-8') as f:
    # # print(f.readable())
    # # print(f.writable())
    #
    # f.seek(10) 调整文件指针,单位是字节,unicode用3个字节表示一个汉字,修改第10个字节,会乱码
    # # print(f.tell())
    # f.write('你好啊')修改文件,是直接从当前指针往后修改,覆盖掉旧内容


    4.文件修改的两种方式
      1.以读的方式打开源文件
      2.将文件内容一次性全读入内存,在内存中完成修改
      3.以写的方式打开源文件,然后将修改的结果一次性写入源文件

    总结:
    优点:在文件修改过程中硬盘只存在一份数据
    缺点:浪费内存

    with open('a.txt',mode='rt',encoding='utf-8') as f1:
      msg=f1.read()
      new_msg=msg.replace('alex','SB')

    with open('a.txt',mode='wt',encoding='utf-8') as f2:
      f2.write(new_msg)

    方式二
     1.以读的方式打开源文件,以写的方式打开一个临时文件
     2.读取源文件的一行内容到内存中,将修改的结果存入临时文件,循环直到全部修改完
    3.删除源文件,将临时文件重命名为源文件名
      优点:同一时间在内存中只有文件的一行内容,更节省内存
    缺点:在文件修改过程中硬盘会存在两份数据 

    with open('b.txt',mode='rt',encoding='utf-8') as read_f,
      open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f:
      for line in read_f:
        write_f.write(line.replace('sb','alex'))
    os.remove('b.txt')
    os.rename('.b.txt.swap','b.txt')
  • 相关阅读:
    NOIP 模拟 $26; m 降雷皇$
    NOIP 模拟 $26; m 神炎皇$
    NOIP 模拟 $25; m queen$
    NOIP 模拟 $25; m string$
    创建自己的数字货币
    Etherscan
    ETH挖矿
    Claymore's Dua Miner挖矿教程
    微擎微赞密码重置
    SQL引擎及事务支持
  • 原文地址:https://www.cnblogs.com/shanau2/p/10021863.html
Copyright © 2011-2022 走看看