zoukankan      html  css  js  c++  java
  • Python 解压缩Zip和Rar文件到指定目录

    #__author__ = 'Joker'
    # -*- coding:utf-8 -*-
    import urllib
    import os
    import os.path
    import zipfile
    from zipfile import *
    import sys
    reload(sys)
    sys.setdefaultencoding('gbk')

    rootdir = "F:/50_GIS/1000_Tools" # 指明被遍历的文件夹
    zipdir = "F:/000_Terrain/zipdir" # 存储解压缩后的文件夹

    #Zip文件处理类
    class ZFile(object):
    def __init__(self, filename, mode='r', basedir=''):
    self.filename = filename
    self.mode = mode
    if self.mode in ('w', 'a'):
    self.zfile = zipfile.ZipFile(filename, self.mode, compression=zipfile.ZIP_DEFLATED)
    else:
    self.zfile = zipfile.ZipFile(filename, self.mode)
    self.basedir = basedir
    if not self.basedir:
    self.basedir = os.path.dirname(filename)

    def addfile(self, path, arcname=None):
    path = path.replace('//', '/')
    if not arcname:
    if path.startswith(self.basedir):
    arcname = path[len(self.basedir):]
    else:
    arcname = ''
    self.zfile.write(path, arcname)

    def addfiles(self, paths):
    for path in paths:
    if isinstance(path, tuple):
    self.addfile(*path)
    else:
    self.addfile(path)

    def close(self):
    self.zfile.close()

    def extract_to(self, path):
    for p in self.zfile.namelist():
    self.extract(p, path)

    def extract(self, filename, path):
    if not filename.endswith('/'):
    f = os.path.join(path, filename)
    dir = os.path.dirname(f)
    if not os.path.exists(dir):
    os.makedirs(dir)
    file(f, 'wb').write(self.zfile.read(filename))

    #创建Zip文件
    def createZip(zfile, files):
    z = ZFile(zfile, 'w')
    z.addfiles(files)
    z.close()

    #解压缩Zip到指定文件夹
    def extractZip(zfile, path):
    z = ZFile(zfile)
    z.extract_to(path)
    z.close()

    #解压缩rar到指定文件夹
    def extractRar(zfile, path):
    rar_command1 = "WinRAR.exe x -ibck %s %s" % (zfile, path)
    rar_command2 = r'"C:WinRAR.exe" x -ibck %s %s' % (zfile, path)
    if os.system(rar_command1) == 0:
    print "Path OK."
    else:

    if os.system(rar_command2) != 0:
    print "Error."
    else:
    print "Exe OK"

    #获得文件名和后缀
    def GetFileNameAndExt(filename):
    (filepath,tempfilename) = os.path.split(filename);
    (shotname,extension) = os.path.splitext(tempfilename);
    return shotname,extension

    #定义文件处理数量-全局变量
    fileCount = 0

    #递归获得rar文件集合
    def getFiles(filepath):
    #遍历filepath下所有文件,包括子目录
    files = os.listdir(filepath)
    for fi in files:
    fi_d = os.path.join(filepath,fi)
    if os.path.isdir(fi_d):
    getFiles(fi_d)
    else:
    global fileCount
    global zipdir
    fileCount = fileCount + 1
    # print fileCount
    fileName = os.path.join(filepath,fi_d)
    filenamenoext = GetFileNameAndExt(fileName)[0]
    fileext = GetFileNameAndExt(fileName)[1]
    # 如果要保存到同一个文件夹,将文件名设为空
    filenamenoext = ""
    zipdirdest = zipdir + "/" + filenamenoext + "/"
    if fileext in ['.zip','.rar']:
    if not os.path.isdir(zipdirdest):
    os.mkdir(zipdirdest)
    if fileext == ".zip" :#
    print str(fileCount) + " -- " + fileName
    # unzip(fileName,zipdirdest)
    extractZip(fileName,zipdirdest)
    elif fileext == ".rar":
    print str(fileCount) + " -- " + fileName
    extractRar(fileName, zipdirdest)

    #递归遍历“rootdir”目录下的指定后缀的文件列表
    getFiles(rootdir)

    Zip处理:http://www.cnblogs.com/qq78292959/archive/2013/03/27/2985310.html
    文件处理参考:http://www.cnblogs.com/txw1958/archive/2012/03/08/2385540.html


    读取Zip文件

    随便一个zip文件,我这里用了bb.zip,就是一个文件夹bb,里面有个文件aa.txt。

    import zipfile
    
    # 默认模式r,读
    azip = zipfile.ZipFile('bb.zip')  # ['bb/', 'bb/aa.txt']
    # 返回所有文件夹和文件
    print(azip.namelist())
    # # 返回该zip的文件名
    print(azip.filename)
    
    # 压缩文件里bb文件夹下的aa.txt
    azip_info = azip.getinfo('bb/aa.txt')
    # 原来文件大小
    print(azip_info.file_size)
    # 压缩后大小
    print(azip_info.compress_size)
    
    # 这样可以求得压缩率,保留小数点后两位
    print('压缩率为{:.2f}'.format(azip_info.file_size/azip_info.compress_size))
    

    可以看到打开方式并不是想象中的open,而是ZipFile。用namelist()可以返回里面所有的文件夹和文件路径。getinfo可以获得某路径下文件的信息,如上。

    还能直接读取压缩包里文件的内容,下面两种方法得到的结果是一样的。需要注意的是,读取出来的数据好像是字节形式的,解码成utf-8就好

    # 可以直接读取里面的内容, 不过貌似是字节形式.需要解码回utf-8.参数也可以传ZiInfo, 如b
    a = azip.read('bb/cc.txt').decode('utf-8')
    print(a)
    # 打开文件再读取,好像比上面麻烦
    b = azip.open(azip_info)
    print(b.read().decode('utf-8'))
    azip.close()

    用完资源后记得主动close。

    解压Zip

    最为关键的功能,一句搞定。默认解压在当前工作目录,可以指定解压目录。

    azip.extractall()

    新建Zip文件

    不仅能读还能写。新建压缩包的时候,可以选择压缩算法,比如DEFLATED和LZMA

    # 新建压缩包,放文件进去,若压缩包已经存在,将覆盖。可选择用a模式,追加
    azip = zipfile.ZipFile('bb.zip', 'w')
    # 必须保证路径存在,将bb件夹(及其下aa.txt)添加到压缩包,压缩算法LZMA
    azip.write('D:/bb/aa.txt', compress_type=zipfile.ZIP_LZMA)
    # 写入一个新文件到压缩包中,data是该文件的具体内容,可以是str或者是byte。
    # 这里是新建一个bb文件夹,其下再新建一个cc.txt,将hello world写入到文本中
    azip.writestr('bb/cc.txt', data='Hello World', compress_type=zipfile.ZIP_DEFLATED)
    # 关闭资源
    azip.close()

    上面有两个方法比较类似,注意区分。

    • write指的是将已经存在的文件复制到压缩包,包括路径中的所有文件夹河其下的文件。
    • writestr是直接在压缩包里新建文件夹和文件,data参数是往该文件中写入的内容。

    最终压缩包里会被添加bb文件夹,其下有aa.txtcc.txt

    将整个文件夹添加到压缩包中

    如果我们这样写,想象着能添加bb文件夹下所有内容到压缩包中,那就不对了。这样添加,只会把bb文件夹复制过去,也仅仅如此,里面的文件不会添加到压缩包。最后得到的只是一个空文件夹。

    azip.write(r'D:/bb', compress_type=zipfile.ZIP_LZMA)

    那怎么办呢?只好递归查找添加了,os.walk刚好可以帮助我们。

    for current_path, subfolders, filesname in os.walk(r'D:b'):
        print(current_path, subfolders, filesname)
        #  filesname是一个列表,我们需要里面的每个文件名和当前路径组合
        for file in filesname:
            # 将当前路径与当前路径下的文件名组合,就是当前文件的绝对路径
            azip.write(os.path.join(current_path, file))
    # 关闭资源
    azip.close()
    

    正确选用变量,元组中第一个是当前路径,而第三个是当前路径下的文件,两者一组合刚好就是文件的绝对路径。

    这样就可以实现添加整个文件夹添加到压缩包了。而且是这些路径下所有的文件夹和其下的文件全部添加。也就是说,保留了原文件夹的结构层次。

    shutil添加压缩包和解压缩

    shuitl模块有个函数,可以方便地添加整个整个文件夹到压缩包。

    # 第一个参数是归档文件名称,第二个参数是指定的格式,不仅是支持zip,第三个参数是要压缩文件/文件夹的路径
    shutil.make_archive('archive_name', 'zip', r'F:IDE Setting')
    # shutil.get_archive_formats() 可以查看支持的格式

    当然也可以解压缩,可指定解压目录,否则默认解压到当前工作目录

    shutil.unpack_archive(r'D:b.zip')
    
    # shutil.get_unpack_formats() 可以查看支持的格式
  • 相关阅读:
    Sublime Text3 支持Less
    Typescript + React-Router + Webpack 实现按需打包/加载
    从零开始配置TypeScript + React + React-Router + Redux + Webpack开发环境
    JavaScript中的一些小细节
    微信小程序(safair浏览器)flex布局中的坑
    使用YQL解决让前端爬取网页并解析
    react diff算法剖析总结
    微信小程序IOS系统中,倒计时(setInterval函数)失效的问题
    微信小程序中未解决的坑
    利用nodejs监控文件变化并使用sftp上传到服务器
  • 原文地址:https://www.cnblogs.com/klb561/p/9982742.html
Copyright © 2011-2022 走看看