zoukankan      html  css  js  c++  java
  • python---filecmp 实现文件,目录,遍历子目录的差异对比功能。

      ilecmp可以实现文件,目录,遍历子目录的差异对比功能。

      自带filecmp模块,无需安装。

    常用方法说明

      filecmp提供3个操作方法,cmp(单文件对比),cmpfile(多文件对比),dircmp(目录对比).

      单文件对比,filecmp.cmp(f1,f2[,shallow])

      f1 f2为文件,相同True,不同False,shallow默认为True,只根据os.stat()方法返回的文件基本信息进行对比。比如最后访问时间,修改时间,状态改变时间等,会忽略文件内容的对比,当shallow为False时,则os.stat()与文件内容同时进行校验。

    1 >>>filrcmp.cmp("/temp/a1","/temp/a2")
    2 >>>True
    3 
    4 >>>filrcmp.cmp("/temp/a1","/temp/a3")
    5 >>>False

      多文件对比,采用filecmp.cmpfiles(dir1, dir2, common[, shallow])
      比较两个文件夹内指定文件是否相等。参数dir1, dir2指定要比较的文件夹,参数common指定要比较的文件名列表。函数返回包含3个list元素的元组,分别表示匹配、不匹配以及错误的文件列表。错误的文件指的是不存在的文件,或文件被琐定不可读,或没权限读文件,或者由于其他原因访问不了该文件。

      目录对比,通过 filecmp(a,b[,ignore[,hide]])类创建一个目录比较对象
      用于比较文件夹,通过该类比较两个文件夹,可以获取一些详细的比较结果(如只在A文件夹存在的文件列表),并支持子文件夹的递归比较。

    dircmp#提供了三个方法用于报告比较的结果:
    report():#只比较指定文件夹中的内容(文件与文件夹)
    report_partial_closure():#比较文件夹及第一级子文件夹的内容
    report_full_closure():#递归比较所有的文件夹的内容
    复制代码
    #dircmp还提供了下面这些属性用于获取比较的详细结果
    left_list:#左边文件夹中的文件与文件夹列表;
    right_list:#右边文件夹中的文件与文件夹列表;
    common:#两边文件夹中都存在的文件或文件夹;
    left_only:#只在左边文件夹中存在的文件或文件夹;
    right_only:#只在右边文件夹中存在的文件或文件夹;
    common_dirs:#两边文件夹都存在的子文件夹;
    common_files:#两边文件夹都存在的子文件;
    common_funny:#两边文件夹都存在的子文件夹;
    same_files:#匹配的文件;
    diff_files:#不匹配的文件;
    funny_files:#两边文件夹中都存在,但无法比较的文件;
    subdirs:#将common_dirs 目录映射到新的dircmp对象,格式为字典的类型。
    复制代码
    复制代码
     1 #!/usr/bin/python3
     2 #coding:utf-8
     3 import os,sys
     4 import filecmp
     5 import re
     6 import shutil
     7 '''
     8     校验源与备份目录的差异
     9 '''
    10  
    11 holderlist = []
    12 def compareme(dir1,dir2):    #递归获取更新项函数
    13     dircomp = filecmp.dircmp(dir1,dir2)
    14     only_in_one = dircomp.left_only      #源目录新文件或目录 
    15     diff_in_one = dircomp.diff_files     #不匹配文件,源目录文件已发生变化
    16     dirpath = os.path.abspath(dir1)      #定义源目录绝对路径
    17     
    18     #将更新文件或目录追加到holderlist
    19     [ holderlist.append(os.path.abspath(os.path.join(dir1,x))) for x in only_in_one ]
    20     [ holderlist.append(os.path.abspath(os.path.join(dir1,x))) for x in diff_in_one ]
    21     if len(dircomp.common_dirs) > 0:  #判断是否存在相同子目录,以便递归
    22         for item in dircomp.common_dirs:   #递归子目录
    23             compareme(os.path.abspath(os.path.join(dir1,item)),os.path.abspath(os.path.join(dir2,item)))
    24     return holderlist
    25     
    26 def main():
    27     if len(sys.argv) > 2:    #输入源目录与备份目录
    28         dir1 = sys.argv[1]
    29         dir2 = sys.argv[2]
    30     else :
    31         print('Usage:',sys.argv[0],'datadir backdir')
    32         sys.exit()
    33     source_files = compareme(dir1,dir2)    #对比源目录与备份目录
    34     dir1 = os.path.abspath(dir1)    #取绝对路径后,后面不会自动加上'/'
    35  
    36     if not dir2.endswith('/'):
    37         dir2 = dir2+'/'            #备份目录路径加'/'
    38     
    39     dir2 = os.path.abspath(dir2)
    40     destination_files = []
    41     createdir_bool = False
    42     
    43     for item in source_files:     #遍历返回的差异文件或目录清单
    44         destination_dir = re.sub(dir1,dir2,item)    #将源目录差异路径清单对应替换成备份目录,即需要在dir2中创建的差异目录和文件
    45         destination_files.append(destination_dir)
    46         if os.path.isdir(item):      #如果差异路径为目录且不存在,则在备份目录中创建
    47             if not os.path.exists(destination_dir):
    48                 os.makedirs(destination_dir)
    49                 createdir_bool = True   #再次调用copareme函数标记
    50     if createdir_bool :       #重新调用compareme函数,重新遍历新创建目录的内容
    51         destination_files = []
    52         source_files = []
    53         source_files = compareme(dir1,dir2)    #调用compareme函数
    54         for item in source_files:           #获取源目录差异路径清单,对应替换成备份目录
    55             destination_dir = re.sub(dir1,dir2,item)
    56             destination_files.append(destination_dir)
    57             
    58     print('update item:')
    59     print(source_files)     #输出更新项列表清单
    60     copy_pair = zip(source_files,destination_files)  #将源目录与备份目录文件清单拆分成元组
    61     for item in copy_pair:
    62         if os.path.isfile(item[0]):        #判断是否为文件,是则进行复制操作
    63             shutil.copyfile(item[0],item[1])
    64             
    65 if __name__ == '__main__' :
    66     main()
    复制代码
  • 相关阅读:
    创业4
    创业3
    PowerBI开发 第十四篇:使用M公式添加列
    PowerBI开发 第十三篇:增量刷新
    PowerBI开发 第十二篇:钻取
    SSIS 连接数据
    SSIS 调试和故障排除
    SQL Server 日志和代理的错误日志
    SSIS 检查点(CheckPoint)内幕
    SSIS 如何处理逻辑类型的转换?
  • 原文地址:https://www.cnblogs.com/lgj8/p/13192003.html
Copyright © 2011-2022 走看看