zoukankan      html  css  js  c++  java
  • Python-文件操作

    一、文件操作:

      文件操作的流程:

    1 #1、打开i文件,获取文件句柄,并赋值给一个变量
    2 #2、通过文件句柄对文件进行操作
    3 #3、关闭文件

    二、Python中的文件操作流程:

    1 #1. 打开文件,得到文件句柄并赋值给一个变量
    2 f=open('a.txt','r',encoding='utf-8') #默认打开模式就为r,encoding是打开    该文件是用的编码方式,并不是文件的编码方式
    3 
    4 #2. 通过句柄对文件进行操作
    5 data=f.read()
    6 
    7 #3. 关闭文件
    8 f.close()        

    三、fl = open('/PATH/file.txt', 'r', encoding='utf-8')的过程分析

    1 # 由应用程序(pycharm)向系统调用open()
    2 
    3 # 操作系统打开该文件,并返回一个文件句柄给应用程序
    4 
    5 #应用程序将文件句柄赋值给变量fl

    四、特殊注意点:

     1 # 打开一个文件包含两部分资源,一个是操作系统打开的文件,一个是应用程序变量。在操作完一个文件后,必须把这两部分资源回收,而且,变量回收必须在文件结束之后,否则导致文件关闭不了,导致内存白白浪费。但是由于Python自带的垃圾回收机制,变量回收不需要我们去操作。只要执行f.close()
     2 
     3 # 因为有时候还是会忘记关闭文件,所以有如下的方法处理:
     4 with open(‘a.txt’,'r',encoding='utf8)as f:
     5     pass
     6 
     7 利用with,等文件操作完后,文件会自动关闭,不需人为操作,with后可以跟多个,如:
     8 
     9 with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
    10     data=read_f.read()
    11     write_f.write(data)
    12 # 但是注意的是,这样,两个文件名不能一样,比如文件修改:
    13 # 文件修改
    14 src_f=open('xxx','r',encoding='gbk')
    15 data=src_f.readlines()
    16 src_f.close()
    17 
    18 dst_f=open('xxx','w',encoding='gbk')
    19 dst_f.write(data[0])
    20 dst_f.close()
    with使用
    1 f=open(...)是由操作系统打开文件,那么如果我们没有为open指定编码,那么打开文件的默认编码很明显是操作系统说了算了,操作系统会用自己的默认编码去打开文件,在windows下是gbk,在linux下是utf-82 若要保证不乱码,文件以什么方式存的,就要以什么方式打开。
    3 
    4 f=open('a.txt','r',encoding='utf-8')
    5 
    6 字符串 ----> encode ----> 二进制
    7 二进制 ----> decode ----> 字符串
    关于编码

    五、打开文件的模式:  

     1 #1、打开文件的基本模式(默认文本模式,txt 。。。)
     2 r : 只读 ,文件必须存在,不存在抛出异常
     3 w : 只写 ,文件不存在时创建,存在时覆盖原文件(也可以说清空)
     4 a :追加 ,文件存在时,追加,不存在时创建
     5 
     6 # 2、对于非文本文件,我们只能用b模式,表示以字节的方式处理文件(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式)
     7 rb :
     8 wb :
     9 ab :
    10 注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码
    11 
    12 #3. 了解部分
    13 "+" 表示可以同时读写某个文件
    14 r+, 读写【可读,可写】
    15 w+,写读【可读,可写】
    16 a+, 写读【可读,可写】

      1、文件处理读操作:

     1 f=open('a','r',encoding='utf-8') # 等于 f=open('陈粒',encoding='utf-8')
     2 data=f.read()
     3 # print(data)
     4 print(f.readable()) # 是否可读
     5 print('第1行',f.readline(),end='') # 每执行一次读一行
     6 print('第2行',f.readline())
     7 print('第3行',f.readline())
     8 # for i in range(1):
     9 #     pass
    10 print('第4行',f.readline())
    11 print('第5行',f.readline())
    12 print('第6行',f.readline())
    13 print('第7行',f.readline())
    14 
    15 data=f.readlines() # 将每一行内容作为列表的元素(包括回车符),生成一个列表
    16 print(data)
    17 f.close()
    18 
    19 
    20 ## 注意,如果先执行read()后,光标直接移到最后,后续的操作就没有打印出现了
    读操作

      2、文件处理写操作

    1 f=open('陈粒','w',encoding='utf8')
    2 # f.read() # 没有读操作
    3 f.write('11111111
    ')
    4 f.write('222222222
    ')
    5 f.write('333
    4444
    555
    ')
    6 # # f.writable() #是否可写
    7 f.writelines(['555
    ','6666
    '])
    8 f.writelines(['555
    ','6666
    ',1]) # 文件内容只能是字符串,只能写字符串
    9 # f.close()
    写操作

      3、文件处理追加操作

    1 f=open('陈粒1','a',encoding='utf-8')
    2 f.write('写到文件最后')
    3 f.close()
    追加操作

      4、修改文件

     1 # 事实上,文件的修改是,打开原文件,把原文件copy到新的文件,同事修改要改变的地方,再覆盖原来的文件
     2 
     3 # 修改文件:
     4 f = open('a.txt','r',encoding='utf-8')
     5 data = f.readlines()
     6 f.close
     7 
     8 f = open('a.txt','w',encoding='utf-8')
     9 data[0] = 'jack'
    10 f.writelines(data)
    11 f.close()
    如何修改文件
    1 import os
    2 
    3 with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
    4     for line in read_f:
    5         line=line.replace('alex','SB')
    6         write_f.write(line)
    7 
    8 os.remove('a.txt')
    9 os.rename('.a.txt.swap','a.txt') 
    修改文件2

      5、b模式

     1 # f=open('a.txt','rb',encoding='utf-8') #b的方式不能指定编码
     2 f=open('a.txt','rb') #b的方式不能指定编码
     3 data=f.read()
     4 # #'字符串'---------encode---------》bytes
     5 # #bytes---------decode---------》'字符串'
     6 print(data) #b'111
    222
    333
    444
    555
    ' win平台换行
    
     7 print(data.decode('utf-8')) # a.txt是utf-8编码的
     8 # f.close()
     9 
    10 f=open('test22.py','wb') #b的方式不能指定编码
    11 f.write(bytes('1111
    ',encoding='utf-8'))
    12 f.write('杨件'.encode('utf-8')) # 或者调用字符串的encode()方法
    13 
    14 f=open('test22.py','ab') #b的方式不能指定编码
    15 f.write('
    杨件hhh'.encode('utf-8'))
    b模式

      6、文件操作的其他方法

      1 # f=open('a.txt','r+',encoding='utf-8')
      2 # # data=f.read()
      3 # # print(data)
      4 # f.write('你好')
      5 
      6 
      7 # f=open('a.txt','r',encoding='utf-8',newline='') #读取文件中真正的换行符号
      8 # print(f.readlines()) # ['你好
    ']
      9 # f=open('a.txt','r+',encoding='utf-8',newline='') #读取文件中真正的换行符号
     10 
     11 # print(f.closed)
     12 # print(f.encoding)
     13 # f.flush() # 将内存中的内flush到磁盘中
     14 # print(f.readlines())
     15 
     16 # print(f.tell()) #获得光标位置
     17 # f.readline()
     18 # print(f.tell())
     19 
     20 # f.seek(1) # 移动光标
     21 # print(f.tell())
     22 # print(f.readlines())
     23 # f.seek(3)
     24 # print(f.tell())
     25 # print(f.read())
     26 
     27 # data=f.read(1) # 文件操作中 read是一个一个读字符
     28 # print(data)
     29 
     30 
     31 
     32 # f.flush() #讲文件内容从内存刷到硬盘
     33 #
     34 # f.closed #文件如果关闭则返回True
     35 #
     36 # f.encoding #查看使用open打开文件的编码
     37 # f.tell() #查看文件处理当前的光标位置
     38 #
     39 # f.seek(3) #从开头开始算,将光标移动到第三个字节
     40 # f.truncate(10) #从开头开始算,将文件只保留从0-10个字节的内容,文件必须以写方式打开,但是w和w+除外
     41 #
     42 # f=open('d.txt','r',newline='')
     43 #
     44 # data=f.readline().encode('utf-8')
     45 # print(data)
     46 # print(f.tell())
     47 
     48 
     49 
     50 
     51 
     52 
     53 
     54 # f=open('seek.txt','r',encoding='utf-8')
     55 # print(f.tell())
     56 # f.seek(10)
     57 # print(f.tell())
     58 # f.seek(3)
     59 # print(f.tell())
     60 
     61 # f=open('seek.txt','rb')
     62 # print(f.tell())
     63 # f.seek(10,1)
     64 # print(f.tell())
     65 # f.seek(3,1)
     66 # print(f.tell())
     67 
     68 # seek() 如果不用相对位置,可以不用b模式,但是只要用相对位置,就必须用b模式
     69 # seek() 的第一个参数是位置,正序 为 正数,倒序为负数,第二个参数:0 默认从0开始,1 从上次位置开始,2 倒序
     70 
     71 # f=open('a.txt','rb')
     72 # print(f.tell())
     73 # f.seek(-5,2)
     74 # print(f.read())
     75 # # print(f.tell())
     76 # f.seek(3,1)
     77 # print(f.tell())
     78 
     79 ## 只要不是倒序,都是正序,也就是说,如果倒序读到某个位置,此时要在读文件,就是从此处往后读
     80 
     81 
     82 
     83 
     84 
     85 
     86 
     87 # f=open('日志文件','rb')
     88 # data=f.readlines()
     89 # print(data[-1].decode('utf-8'))
     90 #
     91 # f=open('日志文件','rb')
     92 #
     93 # for i in f.readlines():
     94 #     print(i)
     95 
     96 #循环文件的推荐方式,不是一次去不加载到内存中,用一行读一行
     97 # for i in f:
     98 #     print(i)
     99 
    100 
    101 
    102 # for i in f:
    103 #     offs=-10
    104 #     while True:
    105 #         f.seek(offs,2)
    106 #         data=f.readlines()
    107 #         if len(data) > 1:
    108 #             print('文件的最后一行是%s' %(data[-1].decode('utf-8')))
    109 #             break
    110 #         offs*=2
    文件操作其他方法

      

    文件对象方法总结:

    方法 描述
    f.close() 关闭文件,记住用open()打开文件后一定要记得关闭它,否则会占用系统的可打开文件句柄数。
    f.fileno() 获得文件描述符,是一个数字
    f.flush() 刷新输出缓存
    f.isatty() 如果文件是一个交互终端,则返回True,否则返回False。
    f.read([count]) 读出文件,如果有count,则读出count个字节。
    f.readline() 读出一行信息。
    f.readlines() 读出所有行,也就是读出整个文件的信息。列表显示
    f.seek(offset[,where]) 把文件指针移动到相对于where的offset位置。where为0表示文件开始处,这是默认值 ;1表示当前位置;2表示文件结尾。
    f.tell() 获得文件指针位置。
    f.truncate([size]) 截取文件,使文件的大小为size。
    f.write(string) 把string字符串写入文件。
    f.writelines(list) 把list中的字符串一行一行地写入文件,是连续写入文件,没有换行。

      

      

    为什么要坚持,想一想当初!
  • 相关阅读:
    检查SQL Server 2005的索引密度和碎片信息(转)
    数据库系统异常排查之DMV(转)
    sql server性能分析--执行sql次数和逻辑次数
    sql语句优化
    C#获取文件夹下的所有文件的文件名
    siebel学习笔记-应用/数据访问控制
    FlexPaper实现文档在线浏览(附源码)
    C# Process.WaitForExit()与死锁
    前端网站
    微信小程序
  • 原文地址:https://www.cnblogs.com/JerryZao/p/8631220.html
Copyright © 2011-2022 走看看