zoukankan      html  css  js  c++  java
  • Python学习之==>文件操作

    1、打开文件的模式

    1 r,只读模式(默认)【不可写;文件不存在,会报错】
    2 w,只写模式【不可读;不存在则创建;存在则删除内容】
    3 a,追加模式【不可读;不存在则创建;存在则追加内容】
    4 r+,读写模式【可读、可写、可追加,如果打开的文件不存在的话,会报错】
    5 w+,写读模式【使用w+的话,已经存在的文件内容会被清空,可以读到已经写的文件内容】
    6 a+,追加读写模式【不存在则创建;存在则只追加内容;】

    2、文件基本操作

    1 # 打开文件(python默认字符集为utf-8,windows为gbk,所以要指定encoding='utf-8'),不输入模式默认为r模式
    2 m = open('words',encoding='utf-8')
    3 print(m.read())        # 读文件
    4 print(m.readline())    # 读取第一行
    5 print(m.readlines())   # 把文件的每一行放到一个list里面

    3、文件操作方法

     1 f = open('words','r+',encoding='utf-8')  # encoding参数可以指定文件的编码
     2 f.readline()  # 读一行
     3 f.readable()  # 判断文件是否可读
     4 f.writable()  # 判断文件是否可写
     5 f.encoding    # 打印文件的编码
     6 f.read()      # 读取所有内容,大文件时不要用,因为会把文件内容都读到内存中,内存不够的话,会把内存撑爆
     7 f.readlines() # 读取所有文件内容,返回一个list,元素是每行的数据,大文件时不要用,原因和上面一样
     8 f.tell()      # 获取当前文件的指针指向
     9 f.seek(0)     # 把当前文件指针指向哪
    10 f.write('爱情证书') # 写入内容
    11 f.flush()     # 写入文件后,立即从内存中把数据写到磁盘中
    12 f.truncate()  # 清空文件内容
    13 f.writelines(['爱情证书','孙燕姿']) # 将一个列表写入文件中
    14 f.close()     # 关闭文件

    4、大文件读取高效操作方法

    用上面的read()和readlines()方法操作文件的话,会先把文件所有内容读到内存中,这样的话,内存数据一多,非常卡,高效的操作,就是读一行操作一行,读过的内容就从内存中释放了,如下:

    1 # 这样的话,line就是每行文件的内容,读完一行的话,就会释放一行的内存
    2 f = open('words',encoding='utf-8')
    3 for line in f:
    4     print(line)

    5、文件指针

    1 # 用来记录文件读到哪里
    2 # a模式的文件指针是在末尾的
    3 m = open('name','a+',encoding='utf-8')
    4 m.write('呃呃呃')
    5 m.seek(0)          # 移动文件指针到最前面
    6 print(m.read())
    7 m.write('呵呵呵')  # 移动完文件指针之后,从前面开始读,但写的时候还是在文件末尾写
    8 m.seek(0)
    9 print(m.read())

    6、自动关闭文件

    在操作文件的时候,经常会忘了关闭文件。可以使用with,它会在使用完这个文件句柄之后,自动关闭该文件,使用方式如下:

    1 # 打开一个文件,把这个文件的句柄付给f
    2 with open('file.txt', 'r') as f:
    3     for line in f:
    4         print(line)
    5         
    6 # 这是多文件的操作,打开两个文件,fr是读file.txt,fw是新建一个file_bak文件
    7 with open('file.txt') as fr,open('file_bak', 'w') as fw:
    8     for line in fr:     # 循环file.txt中的每一行
    9         fw.write(line)  # 写到file_bak文件中

    7、修改文件

    修改文件有两种方式:

    • 一种是把文件的全部内容都读到内存中,然后把原有的文件内容清空,重新写新的内容
    • 第二种是把修改后的文件内容写到一个新的文件中

    第一种方式:

    1 with open('words','r+',encoding='utf-8') as fr:
    2     res = fr.read()    # 读出文件中的全部内容
    3     new_res = res.replace('','flower')  # 将'花'替换成'flower'
    4     fr.seek(0)         # 将文件指针指向文件最开头
    5     fr.truncate()      # 清空文件
    6     fr.write(new_res)  # 将替换后的内容写入文件

    第二种方式:

    1 # 这个是多文件的操作,打开两个文件,fr是读file.txt,fw是新建一个file_bak文件
    2 import os
    3 with open('file') as fr,open('new_file','w') as fw:
    4     for line in fr:  # 循环file.txt中的每一行
    5         new_line = line.replace('','flower')
    6         fw.write(new_line) # 写到file_bak文件中
    7         os.remove('file')  # 删除文件
    8         os.rename('new_file','file') # 改名

    8、f.write()和f.writelines()

     1 # f.write()只能写字符串
     2 a = ['abc
    ','123
    ','!@#']
     3 f = open('name','w')
     4 for i in a:
     5     f.write(i)
     6 
     7 # f.writelines()会循环把list当中的元素写入文件
     8 a = ['abc
    ','123
    ','!@#']
     9 f = open('name','w')
    10 f.writelines(a)

    9、练习

    (1)随机产生手机号,输入多少个就产生多少个

    import random
    start_num = '1387691'
    f = open('test.txt','w',encoding='utf-8')
    num = input('请输入要产生的手机号个数:')
    for i in range(int(num)):
        random_num = str(random.randint(1,9999))   # 随机产生一个1-9999的数字
        new_num = random_num.zfill(4)              # 不够四位,前面补0
        phone_num = start_num + new_num
        f.write(phone_num + '
    ')
    f.close()

    (2)监控日志,一分钟读一次日志文件,如果一分钟之内访问博客的IP地址超过50次,就把这个IP记录下加入黑名单

     1 # 分析:
     2     #打开日志文件
     3     #把ip地址拿出来
     4     #判断每一个ip出现的次数,如果大于50次,记录下来,加入黑名单
     5     #每分钟读一次
     6 import time
     7 point = 0
     8 while True:
     9     all_ips = []             #存放所有的IP地址
    10     f = open('access.log',encoding='utf-8')
    11     f.seek(point)            #移动文件指针
    12     for line in f:           #直接循环一个文件对象,每次循环的是文件的一行
    13         ip = line.split()[0] #拿到IP地址
    14         all_ips.append(ip)   #把它存入数组当中
    15     point = f.tell()         #记录指针位置
    16     all_ip_set = set(all_ips)
    17     for ip in all_ip_set:    #循环集合当中的IP,没有重复的
    18         if all_ips.count(ip) > 50:  #判断的是数组当中的IP
    19             print('攻击的ip是:%s'%ip)
    20     f.close()
    21     time.sleep(2)
  • 相关阅读:
    Java阶段测试题一
    HttpClient配置及运用(一)
    字符串数组及链表的应用:例题
    Java多线程
    String普通方法测试;可变参数
    Java连接mysql数据库
    JS练习
    foreach遍历、包装类、Object类
    Java多态总结
    类的关联,不同类属性的调用
  • 原文地址:https://www.cnblogs.com/L-Test/p/8983190.html
Copyright © 2011-2022 走看看