zoukankan      html  css  js  c++  java
  • python基础之文件处理

    一.文件处理流程

    1. 打开文件,得到文件句柄并赋值给一个变量
    2. 通过句柄对文件进行操作
    3. 关闭文件
    正趣果上果
    Interesting fruit fruit
    
    词:郭婞
    曲:陈粒
    编曲/混音/和声:燕池
    萧:吗子
    Words: Guo 婞
    Song: Chen tablets
    Arrange / Mix / Harmony: Yan Chi
    Xiao: Well
    
    你佩桃木降妖剑
    他会一招不要脸
    哇呀呀呀
    输在没有钱
    输在没有钱
    You wear peach down demon sword
    He will shamelessly
    Wow yeah
    Lost in the absence of money
    Lost in the absence of money
    
    你愿终老不羡仙
    谁料温柔终老空了长生殿
    哎唏唏唏
    败给好容颜
    败给好容颜
    You would like to end the old do not envy cents
    Mummy gentle death of the empty palace
    Hey Xi Xi
    Lost to good appearance
    Lost to good appearance
    
    人生在世三万天
    趣果有间 孤独无解
    苦练含笑半步癫
    呐我去给你煮碗面
    Life is thirty thousand days
    Fun fruit there is no solution between solitude
    Hard practicing smiling half-step epilepsy
    I'll go and cook your bowl
    
    心怀啮雪大志愿
    被人称作小可怜
    呜呼呼呼
    突样未成年
    突样未成年
    Heart of the snow big volunteer
    Was called a small pitiful
    Alas
    Sudden sample of minor
    Sudden sample of minor
    
    本欲歃血定风月
    乌飞兔走光阴只负尾生约
    噫嘘嘘嘘
    真心怕火炼
    真心也怕火炼
    The desire to set the wind blood months
    Wu Flying Rabbit only time to bear the tail about
    噫 boo boo
    Really afraid of fire refining
    Really afraid of fire
    
    人生在世三万天
    趣果有间 孤独无解
    苦练含笑半步癫
    呐我去给你煮碗面
    Life is thirty thousand days
    Fun fruit there is no solution between solitude
    Hard practicing smiling half-step epilepsy
    I'll go and cook your bowl
    
    是非对错二十念
    十方观遍 庸人恋阙
    自学睡梦罗汉拳
    吓 冇知酱紫好危险
    Right and wrong twenty read
    square view over the Yong love Que
    Self - study sleep Lohan boxing
    Scare know that a good risk of Jiang Xi
    
    示范文件内容
    示范文件内容

    二.基本操作

    2.1 文件操作基本流程初探

    文件保存编码如下

    此刻错误的打开方式
    #不指定打开编码,即python解释器默认编码,python2.*为ascii,python3.*为utf-8
    f=open('chenli.txt')
    f.read() 
    

    正确的打开方式
    f=open('chenli.txt',encoding='gbk')
    f.read()
    

    2.3 文件打开模式

    1 文件句柄 = open('文件路径', '模式')
    

    打开文件时,需要指定文件路径和以何等方式打开文件,打开后,即可获取该文件句柄,日后通过此文件句柄对该文件操作。

    打开文件的模式有:

    • r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
    • w,只写模式【不可读;不存在则创建;存在则清空内容】
    • x, 只写模式【不可读;不存在则创建,存在则报错】
    • a, 追加模式【可读;   不存在则创建;存在则只追加内容】

    "+" 表示可以同时读写某个文件

    • r+, 读写【可读,可写】
    • w+,写读【可读,可写】
    • x+ ,写读【可读,可写】
    • a+, 写读【可读,可写】

     "b"表示以字节的方式操作

    • rb  或 r+b
    • wb 或 w+b
    • xb 或 w+b
    • ab 或 a+b

     注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码

    2.4 文件内置函数flush

    flush原理:

    1. 文件操作是通过软件将文件从硬盘读到内存
    2. 写入文件的操作也都是存入内存缓冲区buffer(内存速度快于硬盘,如果写入文件的数据都从内存刷到硬盘,内存与硬盘的速度延迟会被无限放大,效率变低,所以要刷到硬盘的数据我们统一往内存的一小块空间即buffer中放,一段时间后操作系统会将buffer中数据一次性刷到硬盘)
    3. flush即,强制将写入的数据刷到硬盘

    滚动条:

    import sys,time
    
    for i in  range(10):
        sys.stdout.write('#')
        sys.stdout.flush()
        time.sleep(0.2)
    

    2.5 文件内光标移动

    注意:read(3)代表读取3个字符,其余的文件内光标移动都是以字节为单位如seek,tell,read,truncate

    整理中

    2.6 open函数详解

    1. open()语法

    open(file[, mode[, buffering[, encoding[, errors[, newline[, closefd=True]]]]]])
    open函数有很多的参数,常用的是file,mode和encoding
    file文件位置,需要加引号
    mode文件打开模式,见下面3
    buffering的可取值有0,1,>1三个,0代表buffer关闭(只适用于二进制模式),1代表line buffer(只适用于文本模式),>1表示初始化的buffer大小;
    encoding表示的是返回的数据采用何种编码,一般采用utf8或者gbk;
    errors的取值一般有strict,ignore,当取strict的时候,字符编码出现问题的时候,会报错,当取ignore的时候,编码出现问题,程序会忽略而过,继续执行下面的程序。
    newline可以取的值有None, , , ”, ‘ ',用于区分换行符,但是这个参数只对文本模式有效;
    closefd的取值,是与传入的文件参数有关,默认情况下为True,传入的file参数为文件的文件名,取值为False的时候,file只能是文件描述符,什么是文件描述符,就是一个非负整数,在Unix内核的系统中,打开一个文件,便会返回一个文件描述符。

    2. Python中file()与open()区别
    两者都能够打开文件,对文件进行操作,也具有相似的用法和参数,但是,这两种文件打开方式有本质的区别,file为文件类,用file()来打开文件,相当于这是在构造文件类,而用open()打开文件,是用python的内建函数来操作,建议使用open

    3. 参数mode的基本取值

    Character Meaning
    ‘r' open for reading (default)
    ‘w' open for writing, truncating the file first
    ‘a' open for writing, appending to the end of the file if it exists
    ‘b' binary mode
    ‘t' text mode (default)
    ‘+' open a disk file for updating (reading and writing)
    ‘U' universal newline mode (for backwards compatibility; should not be used in new code)

    r、w、a为打开文件的基本模式,对应着只读、只写、追加模式;
    b、t、+、U这四个字符,与以上的文件打开模式组合使用,二进制模式,文本模式,读写模式、通用换行符,根据实际情况组合使用、

    常见的mode取值组合

     1 r或rt 默认模式,文本模式读
     2 rb   二进制文件
     3     
     4 w或wt 文本模式写,打开前文件存储被清空
     5 wb  二进制写,文件存储同样被清空
     6     
     7 a  追加模式,只能写在文件末尾
     8 a+ 可读写模式,写只能写在文件末尾
     9     
    10 w+ 可读写,与a+的区别是要清空文件内容
    11 r+ 可读写,与a+的区别是可以写到文件任何位置 
    

    2.7 with语句  

    为了避免打开文件后忘记关闭,可以通过with管理上下文,进而优化内存,即:

    with open('log','r') as f:
            pass

    如此方式,当with代码块执行完毕时,内部会自动关闭并释放文件资源。
    在Python 2.7 后,with又支持同时对多个文件的上下文进行管理,即:

    with open('log1') as obj1, open('log2') as obj2:
        pass

    2.8 Python3 File seek() 方法

    seek() 方法用于移动文件读取指针到指定位置。
    seek()方法语法如下:
      fileObject.seek(offset[,whence])

    参数

    • offset--开始的偏移量,也就是代表需要移动偏移的字节数
    • whence:可选,默认值为0.给offset参数一个定义,表示要从哪个位置开始偏移;0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件末尾算起。

    返回值
      该函数没有返回值。

    例子1:这种模式是按照字符来操作

    f=open("new_test","r",encoding="utf8")  #hello哈
    print(f.read(3))   # hel
    f.seek(0)
     
    print("------")
    print(f.read())  # hello哈
    

    例子2:这种模式是按照字节来操作

    f=open("new_test","rb")  #hello哈
    print(f.read(3))   # b'hel'
    f.seek(-3,2)  # 该模式一定按字节操作
     
    print("------")
    print(f.read().decode("utf8"))  # 哈
    

    滚动条:

    import sys,time
     
    for i in  range(10):
        sys.stdout.write('#')
        sys.stdout.flush()
        time.sleep(0.2)
    

    百分比显示滚动条:

    import sys,time
    for i in range(100):
        s="
    %d%% %s" %(i,"#"*i)
        sys.stdout.write(s)
        sys.stdout.flush()
        time.sleep(0.5)
    

    2.9 eval用法

    eval(str) 用来计算在字符串中的有效Python表达式,并返回一个对象

    例如:把字符串转成字典

    a=input("pls{....}:")  # {"name":"luchuan"}
    print(type(a)) #<class 'str'>
    a=eval(a)
     
    print(type(a)) #<class 'dict'>
    print(a["name"]) #alex
    

    3.0 truncate方法

    truncate只有在写模式才能用
    truncate()方法用于截断文件,如果指定了可选参数size,则表示截断文件为size个字符。如果没有指定size,则重置到当前位置。

    f=open('a.txt','w')
    f.write('1111111111
    ')
    f.write('1111111111
    ')
    f.write('1111111111
    ')
    f.seek(0)
    f.truncate(3)
    

    3.1 writelines方法

    f=open('a.txt','w')
    f.writelines(['1111111
    ','11111111
    '])
    f.close()
    

    思考题:

    硬盘数据是在block块上,数据只能追加和覆盖,不能进行修改。
    内存里的数据是可以修改得。

    现在需要对以下test文件进行修改,应该怎么操作?

    test内容:
    昨夜寒蛩不住鸣。
    惊回千里梦,已三更。
    起来独自绕阶行。
    人悄悄,帘外月胧明。
    白首为功名,旧山松竹老,阻归程。
    欲将心事付瑶琴。
    知音少,弦断有谁听。
    
    count = 0
    with open("test",encoding="utf8") as f_read,open("test2",encoding="utf8",mode="w") as f_write:
        for line in f_read:
            if count==3:
                line="".join([line.strip(),"张飞
    "])
            f_write.write(line)
            count+=1
     
    import os
    os.rename("test","test_bak")
    os.rename("test2","test")
    View Code

    参考链接:http://www.cnblogs.com/linhaifeng/articles/5984922.html

      

      

      

     

      

      

      

  • 相关阅读:
    python爬虫面试总结
    Android 开发之避免被第三方使用代理抓包
    类的惰性属性
    [转载]Python: 你不知道的 super
    转 白话解析:一致性哈希算法 consistent hashing
    转 appium解决每次运行都需要安装Unlock以及AppiumSetting的问题
    233
    windows中Appium-desktop配合夜神模拟器的使用
    CentOS 6.4 添加永久静态路由所有方法汇总(原创)
    牛逼的lsof命令!!!
  • 原文地址:https://www.cnblogs.com/bingabcd/p/6667077.html
Copyright © 2011-2022 走看看