zoukankan      html  css  js  c++  java
  • Python文件操作

    一、文件操作:

    1. 文件写入模式:

        os.mknod("test.txt")        创建空文件
        f1 = open("test.txt",w)     直接打开一个文件,如果文件不存在则创建文件

        关于open 模式:
        w     以写方式打开,
        a     以追加模式打开
        r+     以读写模式打开
        w+     以读写模式打开
        a+     以读写模式打开
        rb     以二进制读模式打开
        wb     以二进制写模式打开
        ab     以二进制追加模式打开
        rb+    以二进制读写模式打开
        wb+    以二进制读写模式打开
        ab+    以二进制读写模式打开

        对于对于以上文件操作的模式,区别如下图所示:

    write mode compare_thumb[1]

      除以上文件操作模式中,还会用到rb,rb+,wb,wb+,ab,ab+,既然上述的操作模式已经能满足大部分需要,二进制的写入有什么必要呢?

      (1)二进制读文件
      进行读文件操作时,直到读到文档结束符(EOF)才算读取到文件最后,Python会认为字节x1A(26)转换成的字符为文档结束符(EOF),故使用'r'进行读取二进制文件时,可能会出现文档读取不全的现象。
        举例如下:
            二进制文件中存在如下从低位向高位排列的数据:7F 32 1A 2F 3D 2C 12 2E 76
              如果使用'r'进行读取,则读到第三个字节,即认为文件结束。
              如果使用'rb'按照二进制位进行读取的,不会将读取的字节转换成字符,从而避免了上面的错误。
          解决方案:
              二进制文件就用二进制方法读取'rb'
       小结:
         使用'r'的时候,如果碰到'0x1A',就视为文件结束,就是EOF。使用'rb'则不存在这个问题,即:如果你用二进制写入再用文件读出的话,如果其中存在'0x1A',就只会读出文件的一部分,使用'rb'会一直读取文件末尾。

        (2)二进制写文件

        对于字符串x='abc def',我们可用len(x)得到它的长度为7, 我们称之为换行符,实际上是0x0A。当我们用'w'即文本方式写的时候,在windows平台上会自动将'0x0A'变成两个字符'0x0D','0x0A',即文件长度实际上变成8。当用'r'文本方式读取时,又自动的转换成原来的换行符。

        如果换成'wb'二进制方式来写的话,则会保持一个字符不变,读取的时候也是原样读取。

        所以如果用文本方式写入,用二进制方式读取的话,就要考虑这多出的一个字节了。'0x0D'也称回车符。

        Linux下不会变,因为linux只使用'0X0A'来表示换行。


    2. 常用操作文件方法:

    f1.read([size])		#size为读取的长度,以byte为单位
    
    f1.readline([size])		#读一行,如果定义了size,有可能返回的只是一行的一部分
    
    f1.readlines([size])		#把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。
    
    f1.write(str)		#把str写到文件中,write()并不会在str后加上一个换行符
    
    f1.writelines(seq)		#把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。
    
    f1.close()		#关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。  如果一个文件在关闭后还对其进行操作会产生ValueError
    
    f1.flush()		#把缓冲区的内容写入硬盘
    
    f1.fileno()		#返回一个长整型的”文件标签“
    
    f1.isatty()		#文件是否是一个终端设备文件(unix系统中的)
    
    f1.tell()		#返回文件操作标记的当前位置,以文件的开头为原点
    
    f1.next()		#返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。
    
    f1.seek(offset[,whence])		#将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。
    
    f1.truncate([size])		#把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。

    二、目录操作:

    1. 常用操作目录方法:

    os.getcwd()		#得到当前工作目录,即当前Python脚本工作的目录路径
    
    os.listdir()	#返回指定目录下的所有文件和目录名
    
    os.remove()		#函数用来删除一个文件
    
    os.removedirs(r“c:python”)		#删除多个目录
    
    os.path.isfile()		#检验给出的路径是否是一个文件
    
    os.path.isdir()		#检验给出的路径是否是一个目录
    
    os.path.isabs()		#判断是否是绝对路径
    
    os.path.exists()		#检验给出的路径是否真地存
    
    os.path.split()     #返回一个路径的目录名和文件名:eg os.path.split('/home/swaroop/byte/code/poem.txt') 结果:('/home/swaroop/byte/code', 'poem.txt') 
    
    os.path.splitext()		#分离扩展名
    
    os.path.dirname()		#获取路径名
    
    os.path.basename()		#获取文件名
    
    os.system()		#运行shell命令
    
    os.getenv() 与os.putenv()		#读取和设置环境变量
    
    os.linesep    #给出当前平台使用的行终止符,Windows使用'
    ',Linux使用'
    '而Mac使用'
    '
    
    os.name       #指示你正在使用的平台:对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'
    
    os.rename("oldname","newname")       文件或目录都是使用这条命令
    
    os.makedirs(r“c:python	est”)		#创建多级目录
    
    os.mkdir(“test”)		#创建单个目录
    
    os.stat(file)		#获取文件属性
    
    os.chmod(file)		#修改文件权限与时间戳
    
    os.exit()		#终止当前进程
    
    os.path.getsize(filename)		#获取文件大小
    
    os.chdir()		#切换工作目录
    	
    os.chroot()		#设定当前进程的根目录
    	
    os.rmdir("dir")		#只能删除空目录
    	
    os.removedirs()		#删除多级目录

       关于shutil模块的使用方法,查看这里

    三、Path操作:

    1. 分隔:

    basename()		#去掉目录路径,返回文件名
    dirname()		#去掉文件名,返回目录路径
    join()		#将分离的各部分组合成一个路径名
    split()		#返回(dirname(),basename())元组
    splitdrive()		#返回(drivename,pathname)元组
    splitext		#返回(filename,extension)元组

    2. 信息:

    getatime()		#返回最近访问时间
    getctime()		#返回文件创建时间
    getmtime()		#返回最近文件修改时间
    getsize()		#返回文件大小(以字节为单位)

    3. 查询:

    exists()		#指定路径(文件或目录)是否存在
    isabs()		#指定路径是否为绝对路径
    isdir()		#指定路径是否存在且为一个目录
    isfile()		#指定路径是否存在且为一个文件
    islink()		#指定路径是否存在且为一个符号链接
    ismount()		#指定路径是否存在且为一个挂载点
    samefile()		#两个路径名是否指向同一个文件

    四、示例:

    (1)判断文件是否存在,存在则打开,让用户通过键盘反复输入多行数据,追加保存至此文件中:

    #!/usr/bin/python
    import os
    import os.path
    filename=raw_input('plz a file name:')
    if os.path.isfile(filename):
            openname= open(filename,'a+')
    while True:
            newline=raw_input('plz a line:')
            if newline == 'q' or newline =='quit':
                    break
            else:
                    openname.write(newline+'
    ')
    openname.close()

    (2)将文件夹下所有图片名称加上'_fc':

    # -*- coding:utf-8 -*-
    import re
    import os
    import time
    #str.split(string)分割字符串
    #'连接符'.join(list) 将列表组成字符串
    def change_name(path):
        global i
        if not os.path.isdir(path) and not os.path.isfile(path):
            return False
        if os.path.isfile(path):
            file_path = os.path.split(path) #分割出目录与文件
            lists = file_path[1].split('.') #分割出文件与文件扩展名
            file_ext = lists[-1] #取出后缀名(列表切片操作)
            img_ext = ['bmp','jpeg','gif','psd','png','jpg']
            if file_ext in img_ext:
                os.rename(path,file_path[0]+'/'+lists[0]+'_fc.'+file_ext)
                i+=1 #注意这里的i是一个陷阱
            #或者
            #img_ext = 'bmp|jpeg|gif|psd|png|jpg'
            #if file_ext in img_ext:
            #    print('ok---'+file_ext)
        elif os.path.isdir(path):
            for x in os.listdir(path):
                change_name(os.path.join(path,x)) #os.path.join()在路径处理上很有用
    
    img_dir = 'D:\xx\xx\images'
    img_dir = img_dir.replace('\','/')
    start = time.time()
    i = 0
    change_name(img_dir)
    c = time.time() - start
    print('程序运行耗时:%0.2f'%(c))
    print('总共处理了 %s 张图片'%(i))
    
    输出结果:
    
    程序运行耗时:0.11
    总共处理了 109 张图片
  • 相关阅读:
    Intellij IDEA 快捷键整理
    Jquery Datatables 请求参数及接收参数处理
    Java 并发编程实战 摘要
    【树莓派】关于盒子服务检测
    RPi Desktop盒子安装与服务配置
    使用Jmeter对API进行性能测试
    【树莓派】RPi desktop系统重启或关机挂起几个问题:plymouth-reboot.service、plymouth-poweroff.service、Deconfiguring network interfaces
    【自动化测试】基于IntelliJ IDEA的Gradle和testNG
    【树莓派】树莓派盒子性能监控管理
    【SCM】关于Gradle与maven的几篇文章
  • 原文地址:https://www.cnblogs.com/stefan-liu/p/5220655.html
Copyright © 2011-2022 走看看