zoukankan      html  css  js  c++  java
  • 文件操作

    主要内容:

    • 1. 初识文件操作
    • 2. 只读(r, rb)
    • 3. 只写(w, wb)
    • 4. 追加(a, ab)
    • 5. r+读写
    • 6. w+写读
    • 7. a+写读(追加写读)
    • 8. 其他操作方法
    • 9. 文件的修改以及另一种打开文件句柄的方式

    1. 初识文件操作 

     使用python来读写文件是非常简单的操作. 我们使用open()函数来打开一个文件, 获取到文件句柄.然后通过文件句柄就可以进行各种各样的操作了.根据打开方式的不同能够执行的操作也会有相应的差异.

     打开文件的方式: r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使用的是r(只读)模式

    2.只读操作(r, rb)

    (1)read

      将文件中的内容全部读取出来. 弊端: 占内存. 如果文件过大.容易导致内存崩溃.

    f= open("倚天屠龙记",mode="r",encoding="UTF-8")
    content = f.read()
    print(content)
    f.close()

    (2)readline()

       ⼀次读取⼀行数据, 注意: readline()结尾, 注意每次读取出来的数据都会有⼀ 个 所以呢. 需要我们使用strip()方法来去掉 或者空

    f= open("倚天屠龙记",mode="r",encoding="UTF-8")
    line1=f.readline().strip()   # 空白: 空格, 	, 
    
    print(line1)      #张无忌
    f.close()

    (3)readlines()

        将每⼀行形成⼀个元素, 放到⼀个列表中. 将所有的内容都读取出来. 所以也是. 容易出现内存崩溃的问题.不推荐使用

    f= open("倚天屠龙记",mode="r",encoding="UTF-8")
    lst = f.readlines()
    print(lst)
    for line in lst:
        print(line.strip())
    f.close()

    (4) 循环读取

    # f是一个可迭代对象
    f= open("倚天屠龙记",mode="r",encoding="UTF-8")
    for line in f:
        print(line.strip())
    f.close

    (5) read(n) 读取n个字符.

         需要注意的是:如果再次读取. 那么会在当前位置继续去读,而不是从头读, 如果使用的是rb模式. 则读取出来的是n个字节

    f= open("倚天屠龙记",mode="r",encoding="UTF-8")
    content = f.read(2)
    print(content)      #张无
    f.close()
    f= open("倚天屠龙记",mode="rb")
    print(f.read(3))
    f.close()    #b'xe5xbcxa0'

    2. 只写(w, wb)

         写的时候注意. 如果没有文件. 则会创建文件, 如果文件存在. 则将原件中原来的内容删除, 再写入新内容

    f = open("write", mode="w", encoding="utf-8")
    f.write("周笔畅
    ") # 写的时候. 先清空. 再写入. w
    f.write("胡辣汤
    ")
    f.write("实付款
    ")
    f.flush()
    f.close() 
    f= open("倚天屠龙记",mode="w",encoding="UTF-8")
    f.write("金毛狮王")
    f.flush()
    f.close()               #金毛狮王
    f= open("倚天屠龙记",mode="w",encoding="UTF-8")
    f.write("金毛狮王")
    f.read()          #UnsupportedOperation: not readable       模式是w. 不不可以执⾏行行读操作
    f.flush()
    f.close()          

    wb模式下. 可以不指定打开文件的编码. 但是在写文件的时候必须将字符串转化成utf-8的 bytes数据

    f= open("倚天屠龙记",mode="wb")
    f.write("金毛狮王".encode("utf-8"))
    f.flush()
    f.close()

    4. 追加(a, ab)

    f = open("倚天屠龙记", mode="a", encoding="utf-8")
    f.write("俞岱岩
    ") # 追加写
    f.write("陈友谅
    ")
    f.flush()
    f.close()

    5. r+读写

    对于读写模式. 必须是先读. 因为默认光标是在开头的. 准备读取的. 当读完了之后再进行写入. 我们以后使用频率最高的模式就是r+ 

    f = open("倚天屠龙记", mode="r+", encoding="utf-8")
    content = f.read()
    f.write("光明左使杨逍")
    print(content)
    f.flush()
    f.close()

    错误方式:

    f = open("倚天屠龙记", mode="r+", encoding="utf-8")
    f.write("光明左使杨逍")
    content = f.read()
    print(content)
    f.flush()
    f.close()                          #将开头内容改为"光明左使杨逍'再往后读

    所以记住: r+模式下. 必须是先读取. 然后再写入 

    6. w+写读

    先将所有的内容清空. 然后写入. 最后读取. 但是读取的内容是空的, 不常用

    f = open("倚天屠龙记", mode="w+", encoding="utf-8")
    f.write("光明左使杨逍")
    print(f.read())
    f.flush()
    f.close()

    先读不就好了了么? 错. w+ 模式下, ⼀开始读取不到数据. 然后写的时候再将原来的内容清空,所以极少用

    7.a+写读(追加写读)

    f = open("倚天屠龙记", mode="a+", encoding="utf-8")
    f.write("光明左使杨逍")
    # f.seek(0)
    print(f.read())
    f.flush()
    f.close()

        a+模式下, 不论先读还是后读. 都是读取不到数据的. 但是移动光标就可以

    8. 其他操作方法

    (1)seek(n)

    •    光标移动到n位置,  注意, 移动的单位是byte. 所以如果是UTF-8的中⽂文部分要是3的倍数.     
    •   通常我们使用seek都是移动到开头或者结尾.         移动到开头: seek(0)        移动到结尾: seek(0,2) 
    •    seek的第⼆个参数表示的是从哪个位置进行偏移, 默认是0,  表示开头, 1表示当前位置, 2表示结尾
    f = open("倚天屠龙记", mode="r+", encoding="utf-8")
    f.write("白眉鹰王殷天正青翼蝠王韦一笑")
    f.seek(0)      #光标移动到开头
    print(f.read())      #读取内容,此时光标移动到结尾
    f.seek(0)             #将光标移至开头
    f.seek(0,2)           #将光标移至结尾
    print(f.read())       #读取内容,什么都没有
    f.seek(0)             #移动到开头
    f.write("朱元璋")     #写入信息,此时光标在
    print(f.tell())        #此时光标位置9
    f.flush()
    f.close()

    (2). tell()

          使用tell()可以帮我们获取到当前光标在什么位置

    (3). truncate() 截断文件

    f = open("倚天屠龙记", mode="r+", encoding="utf-8")
    f.seek(3)
    f.truncate(12) # 如果没有参数. 按照光标来阶段. 如果有参数. 截断到参数位置
    f.flush()
    f.close()

    9. 文件的修改以及另一种打开文件句柄的方式

     文件修改: 只能将文件中的内容读取到内存中, 将信息修改完毕, 然后将源文件删除, 将新 文件的名字改成老⽂文件的名字. 

    import os # 引入os模块
    
    with open("alex", mode="r", encoding="utf-8") as f1, 
         open("alex_副本", mode="w", encoding="utf-8") as f2:
    
        for line in f1:
            new_line = line.replace("good", "ok")
            f2.write(new_line)
    
    os.remove("alex")
    os.rename("alex_副本", "alex")

    弊端: 一次将所有内容进行读取. 内存溢出. 解决方案: ⼀行⼀行的读取和操作

     另外:关于文件拷贝

    f1 = open("G:/路飞01.png", mode="rb")
    f2 = open("E:/路飞02.png", mode="wb")
    for line in f1:
        f2.write(line)
    f1.close()
    f2.flush()
    f2.close()

     Homework

    1.有如下文件,a1.txt,里面的内容为:

    • 老男孩是最好的培训机构,
    • 全心全意为学生服务,
    • 只为学生未来,不为牟利。
    • 我说的都是真的。哈哈

    分别完成以下的功能:

    a,将原文件全部读出来并打印。

    b,在原文件后面追加一行内容:信不信由你,反正我信了。

    c,将原文件全部读出来,并在后面添加一行内容:信不信由你,反正我信了。

    d,将原文件全部清空,换成下面的内容:

    • 每天坚持一点,
    • 每天努力一点,
    • 每天多思考一点,
    • 慢慢你会发现,
    • 你的进步越来越大。

    e,将原文件内容全部读取出来,并在‘我说的都是真的。哈哈’这一行的前面加一行,‘你们就信吧~’然后将更改之后的新内容,写入到一个新文件:a1.txt。

    1.
    with open("a1",mode ="r",encoding="utf-8") as f:
        for line in f:
            print(line.strip())
    
    with open("a1",mode ="a",encoding="utf-8") as f:
        f.write("信不信由你,反正我信了")
    
    with open("a1",mode ="r+",encoding="utf-8") as f:
        f.write("信不信由你,反正我信了")
        for line in f:
            print(line.strip())
    
    with open("a1",mode ="w",encoding="utf-8") as f:
        f.write("""每天坚持一点,
    每天努力一点,
    每天多思考一点,
    慢慢你会发现,
    你的进步越来越大。
    """)
    import os # 引入os模块
    #
    with open("a1",mode ="r",encoding="utf-8") as f1,
        open("a1_副本",mode="a",encoding="utf-8" ) as f2:
        # line1 = f1.readline()
        # f2.write(line1)
        # line2 = f1.readline()
        # f2.write(line2)
        # line3 = f1.readline()
        # f2.write(line3)
        #
        # f2.write("你们就信吧
    ")
        # line4 = f1.readline()
        # f2.write(line4)
        cont = 0
        for i in f1:
            if cont ==3:
                f2.write("你们就信吧
    ")
            f2.write(i)
            cont+=1
    os.remove("a1")
    os.rename("a1_副本", "a1")

    2.有如下文件,t1.txt,里面的内容为:

    • 葫芦娃,葫芦娃,
    • 一根藤上七个瓜
    • 风吹雨打,都不怕,
    • 啦啦啦啦。
    • 我可以算命,而且算的特别准:
    • 上面的内容你肯定是心里默唱出来的,对不对?哈哈

    分别完成下面的功能:

    • a,以r+的模式打开原文件,判断原文件是否可读,是否可写。
    • b,以r的模式打开原文件,利用for循环遍历文件句柄。
    • c,以r的模式打开原文件,以readlines()方法读取出来,并循环遍历         readlines(),并分析b,与c 有什么区别?深入理解文件句柄与                readlines()结果的区别。
    • d,以r模式读取‘葫芦娃,’前四个字符。
    • e,以r模式读取第一行内容,并去除此行前后的空格,制表符,换行符。
    • f,以r模式打开文件,从‘风吹雨打.....’开始读取,一直读到最后。
    • g,以a+模式打开文件,先追加一行:‘老男孩教育’然后在从最开始将         原内容全部读取出来。
    • h,截断原文件,留下内容:‘葫芦娃’
    # with open("t1",mode ="r+",encoding="utf-8") as f:
    #     for line in f:
    #         print(line.strip())
    #     f.write("你说的对")
    
    # with open("t1",mode ="r",encoding="utf-8") as f:
    #     for line in f:
    #        print(line.strip())
    
    # with open("t1",mode ="r",encoding="utf-8") as f:
    #     lst = f.readlines()
    #     print(lst)
    
    # with open("t1",mode ="r",encoding="utf-8") as f:
    #     print(f.read(4))
    
    # with open("t1",mode ="r",encoding="utf-8") as f:
    #     print(f.readline().strip())
    
    # with open("t1",mode ="r",encoding="utf-8") as f:
    #     lst = f.readlines()
    #     for i in range(2,len(lst)):
    #         print(lst[i].strip())
    # 先用readline在for循环
    # with open("t1",mode ="a+",encoding="utf-8") as f:
    #     f.write("老男孩儿教育")
    #     f.seek(0)
    #     for line in f:
    #         print(line.strip())
    
    # with open("t1",mode ="r+",encoding="utf-8") as f:
    #     f.seek(9)
    #     f.truncate()
    ##   f.truncate(9)

     3.文件a.txt内容:每一行内容分别为商品名字,价钱,个数。

    • apple 10 3
    • tesla 100000 1
    • mac 3000 2
    • lenovo 30000 3
    • chicken 10 3

     通过代码,将其构建成这种数据类型:[{'name':'apple','price':10,'amount':3},{'name':'tesla','price':1000000,'amount':1}......] 并计算出总价钱。

    lis=[]
    with open("a",mode ="r",encoding="utf-8") as f:
        for line in f :
            lst = line .strip().split(" ")
            dic ={"name":lst[0],"price":lst[1],"amount":lst[2],}
            lis.append(dic)
    sum =0
    for i in range(len(lis)):
        sum+=int(lis[i]["price"])*int(lis[i]["price"])
    print(sum)

    4,有如下文件:

    • tony是创建人。
    • tony其实是人妖。
    • 谁说tonysb?
    • 你们真逗,tony再牛逼,也掩饰不住资深屌丝的气质。

     将文件中所有的tony都替换成大写的SB(文件的改的操作)

    import os
    with open("4t",mode ="r",encoding="utf-8") as f1,
         open("4t_副本", mode="w", encoding="utf-8") as f2:
        for line in f1:
            new_line= line.replace("tony","SB")
            f2.write(new_line)
    os.remove("4t")
    os.rename("4t_副本", "4t")

    5.文件a1.txt内容(升级题)

    name:apple price:10 amount:3 year:2012
    name:tesla price:100000 amount:1 year:2013

    .......


    通过代码,将其构建成这种数据类型:
    [{'name':'apple','price':10,'amount':3},
    {'name':'tesla','price':1000000,'amount':1}......]
    并计算出总价钱。

    lis=[]
    with open("5t",mode ="r",encoding="utf-8") as f:
        for line in f :
            lst1 = line .strip().split(" ")
            # print(lst1)
            dic = {}
            for i in range(0,3):
                [k,v]=lst1[i].split(":")
                dic.setdefault(k, v)
            print(dic)
            lis.append(dic)
    print(lis)
    sum =0
    for i in range(len(lis)):
        sum+=int(lis[i]["price"])*int(lis[i]["price"])
    print(sum)

     

    5,文件a1.txt内容(升级题)

     序号     部门      人数      平均年龄      备注

    1       python    30         26         单身狗
    2       Linux     26         30         没对象
    3       运营部     20         24         女生多

    .......

    通过代码,将其构建成这种数据类型:
    [{'序号':'1','部门':Python,'人数':30,'平均年龄':26,'备注':'单身狗'},
    ......]

    result=[]
    with open("6t",mode ="r",encoding="utf-8") as f:
        title = f.readline().strip().split(" ")
        # print(title)
        lis1=[]
        lis2=[]
        for i in range(len(title)):
            if title[i]!="":
                lis1.append(title[i])
        print(lis1)
        for line in f:
            lst=line.strip().split(" ")
            for i in range(len(lst)):
                if lst[i] != "":
                    lis2.append(lst[i])
            dic = {lis1[0]: lis2[0], lis1[1]: lis1[1], lis1[2]: lis2[2], lis1[3]: lis2[3], lis1[4]: lis2[4]}
            result.append(dic)
    print(result)

    注意:其实s.split()什么都不写默认是用空白去切

  • 相关阅读:
    Ubuntu命令行快捷启动Matlab
    用xmanager6启动Linux上的图形界面程序
    Winscp远程连接Linux主机,上传和下载文件
    Xshell6连接Ubuntu18.04
    Windows10通过VNC远程连接Ubuntu18.04
    获取Linux ip
    关联Anaconda和最新Pycharm2018.3.2
    asp.net mvc 外网获取不到port问题解决
    js 毫秒换算成秒
    c# 监听文件夹动作
  • 原文地址:https://www.cnblogs.com/wcx666/p/9636553.html
Copyright © 2011-2022 走看看