zoukankan      html  css  js  c++  java
  • python开发_filecmp

    filecmp模块用于比较文件及文件夹的内容,它是一个轻量级的工具,使用非常简单。python标准库还提供了difflib模块用于比较文件的内容。关于difflib模块,且听下回分解。

        filecmp定义了两个函数,用于方便地比较文件与文件夹:

    filecmp.cmp(f1, f2[, shallow]):

        比较两个文件的内容是否匹配。参数f1, f2指定要比较的文件的路径。可选参数shallow指定比较文件时是否需要考虑文件本身的属性(通过os.stat函数可以获得文件属性)。如果文件内容匹配,函数返回True,否则返回False。

    filecmp.cmpfiles(dir1, dir2, common[, shallow]):

        比较两个文件夹内指定文件是否相等。参数dir1, dir2指定要比较的文件夹,参数common指定要比较的文件名列表。函数返回包含3个list元素的元组,分别表示匹配、不匹配以及错误的文件列表。错误的文件指的是不存在的文件,或文件被琐定不可读,或没权限读文件,或者由于其他原因访问不了该文件。

        filecmp模块中定义了一个dircmp类,用于比较文件夹,通过该类比较两个文件夹,可以获取一些详细的比较结果(如只在A文件夹存在的文件列表),并支持子文件夹的递归比较。

    dircmp提供了三个方法用于报告比较的结果

    • report():只比较指定文件夹中的内容(文件与文件夹)
    • report_partial_closure():比较文件夹及第一级子文件夹的内容
    • report_full_closure():递归比较所有的文件夹的内容

    例子:在文件夹"1"中含有文件"1.txt", 在文件夹"2"中含有文件"1.txt"和"2.txt",其两个文件夹下面的文件"1.txt"内容一样,

    1 >>>import filecmp
    2 >>>x = filecmp.dircmp("1", "2")
    3 >>>x.report()
    4 >>>

    diff 1 2

    Only in 2 : ['2.txt']
    Identical files : ['1.txt']

    如果两个文件夹下面的文件"1.txt"内容不相同那么结果如下:

    1 >>>import filecmp
    2 >>>x = filecmp.dircmp("1", "2")
    3 >>>x.report()
    4 >>>

    diff 1 2

    Only in 2 : ['2.txt']
    Differing files : ['1.txt'] 

    dircmp还提供了下面这些属性用于获取比较的详细结果

    • left_list:左边文件夹中的文件与文件夹列表;
    • right_list:右边文件夹中的文件与文件夹列表;
    • common:两边文件夹中都存在的文件或文件夹;
    • left_only:只在左边文件夹中存在的文件或文件夹;
    • right_only:只在右边文件夹中存在的文件或文件夹;
    • common_dirs:两边文件夹都存在的子文件夹;
    • common_files:两边文件夹都存在的子文件;
    • common_funny:两边文件夹都存在的子文件夹;
    • same_files:匹配的文件;
    • diff_files:不匹配的文件;
    • funny_files:两边文件夹中都存在,但无法比较的文件;
    • subdirs:我没看明白这个属性的意思,python手册中的解释如下:A dictionary mapping names in common_dirs to dircmp objects

        简单就是美!我只要文件比较的结果,不想去关心文件是如何是比较的,hey,就用python吧~~

    原文:http://scm002.iteye.com/blog/1662812

    以下是我做的demo:

     1 #python filecmp
     2 #比较文件/文件夹
     3 
     4 from filecmp import *
     5 
     6 def print_diff_files(dcmp):
     7     print(dcmp.diff_files)
     8     for name in dcmp.diff_files:
     9         print("diff_file %s found in %s and %s" % (name, dcmp.left, dcmp.right))
    10     for sub_dcmp in dcmp.subdirs.values():
    11         print_diff_files(sub_dcmp)
    12 
    13 def main():
    14     dirA = 'c:\Download\'
    15     dirB = 'c:\MyDrivers\'
    16     dcmp = dircmp(dirA, dirB)
    17     print_diff_files(dcmp)
    18 
    19 if __name__ == '__main__':
    20     main()
  • 相关阅读:
    ASP.NET ValidationGroup 属性和CssClass 属性
    sql 在将 nvarchar 值 转换成数据类型 int 时失败。
    select 1 from table
    OLEDB和ODBC的区别
    ASP.NET 读数据库绑定到 TreeView 递归方式
    用python做网页抓取与解析入门笔记[zz]
    win8.1安装驱动出现“文件的哈希值不在指定的目录”的解决办法[zz]
    Linux磁盘IO监控[zz]
    硬盘内部硬件结构和工作原理详解[zz]
    fcitx五笔的安装[zz]
  • 原文地址:https://www.cnblogs.com/hongten/p/hongten_python_filecmp.html
Copyright © 2011-2022 走看看