zoukankan      html  css  js  c++  java
  • 使用GZipStream压缩和解压文件

    最近做了一个用.NET里的GZipStream压缩解压缩gzip文件的小程序。
    GZipStream在System.IO.Compression底下,使用起来也很简单。虽然GZipStream是Stream类的一个下级类,但它只相当于一个转换器。在两个Stream之间将数据转换成为压缩或解压缩数据。
    下面是一个简单的例子:
    static void Main(string[] args)
    {
        string inputFileName = @"TestFile/Test.doc";
        string outputFileName = @"TestFile/Test.doc.gz";
       
        // 输入输出数据流
        FileStream inputStream =
            new FileStream(inputFileName, FileMode.Open, FileAccess.Read);
        FileStream outputStream =
            new FileStream(outputFileName, FileMode.Create, FileAccess.Write);
        // 把数据读到一个字节类型的数组里
        byte[] buffer = new byte[inputStream.Length];
        inputStream.Read(buffer, 0, buffer.Length);
       
        GZipStream compressionStream =
            new GZipStream(outputStream, CompressionMode.Compress);
       
        // 把数组里的数据通过GZipStream写入到输出数据流
        compressionStream.Write(buffer, 0, buffer.Length);
        compressionStream.Close();
       
        inputStream.Close();
        outputFileName.Close();
        Console.WriteLine("Finished");
        Console.ReadLine();
    }
    以上这个例子已经可以满足基本的压缩需求,但他还有一个很大的缺点,那就是必须把全部文件都读到内存里(也就是那个字节型的数组),然后才能进行压缩。当压缩很大的文件的时候系统性能会受到很大的影响,甚至可能使系统崩溃。
    所以我给他改进了一下,让他一次只读取和压缩文件的一部份:
    static void Main(string[] args)
    {
        string inputFileName = @"TestFile/Test.doc";
        string outputFileName = @"TestFile/Test.doc.gz";
       
        FileStream inputStream =
            new FileStream(inputFileName, FileMode.Open, FileAccess.Read);
        FileStream outputStream =
            new FileStream(outputFileName, FileMode.Create, FileAccess.Write);
        // 决定一次读取数剧的大小,这里是8KB
        int bufferSize = 8192;
        int bytesRead = 0;
        byte[] buffer = new byte[bufferSize];
        GZipStream compressionStream =
            new GZipStream(outputStream, CompressionMode.Compress);
        // bytesRead返回每次读了多少数据,如果等于0就表示已经没有数据
        // 可以读了
        while ( (bytesRead = inputStream.Read(buffer, 0, bufferSize)) > 0)
        {
            // 把读到数组中的数据通过GZipStream写入到输出数据流
            compressionStream.Write(buffer, 0, bytesRead);
        }
        compressionStream.Close();
       
        inputStream.Close();
        outputStream.Close();
        Console.WriteLine("Finished");
        Console.ReadLine();
    }
    好子,现在可以解决刚才提到的性能问题了。
    解压缩文件和压缩文件基本一样,只不过这次GZipStream是要从已经压缩了文件中读取数据并解压缩,然后把解压后的数据写入到另一个文件,所以这次GZipStream是在读,看一面的例子:
    static void Main(string[] args)
    {
        string inputFileName = @"TestFile/Test.doc.gz";
        string outputFileName = @"TestFile/Test_unzipped.doc";
       
        FileStream inputStream =
            new FileStream(inputFileName, FileMode.Open, FileAccess.Read);
        FileStream outputStream =
            new FileStream(outputFileName, FileMode.Create, FileAccess.Write);
       
        int bufferSize = 8192;
        int bytesRead = 0;
        byte[] buffer = new byte[bufferSize];
        GZipStream decompressionStream =
            new GZipStream(inputStream, CompressionMode.Decompress);
        // 把压缩了的数据通过GZipStream解压缩后再读出来
        // 读出来的数据就存在数组里
        while ( (bytesRead = decompressionStream.Read(buffer, 0, bufferSize)) > 0)
        {
            // 把解压后的数据写入到输出数据流
            outputStream.Write(buffer, 0, bytesRead);
        }
        decompressionStream.Close();
       
        inputStream.Close();
        outputStream.Close();
        Console.WriteLine("Finished");
        Console.ReadLine();
    }
    我把刚才写的程序优化了一下,制作了一个比较容易使用的GZip工具 -- GZipTool,下面是这个工具支持的几个方法:
    // 压缩指定文件,跟踪压缩进度,设置缓冲大小
    GZipTool.Compress(string inputFileName, ProgressHandler handler, int bufferSize);
    示例:
    static void Main(string[] args)
    {
        string inputFileName = @"TestFile/Test.doc";
       
        // 压缩指定文件,显示进度,并设定一次压缩数据的大小
        GZipTool.Compress(inputFileName,
            new GZipTool.ProgressHandler(_progress), 20480);
        Console.WriteLine("Finished");
        Console.ReadLine();
    }
    // 显示进度数据
    private static void _progress(long totalBytesProcessed, long totalBytes)
    {
        Console.WriteLine(
            (
            (double)totalBytesProcessed / (double) totalBytes).ToString("P")        );
    }
    GZipTool还支持把数据直接压缩成为数据流,可以在网络传输等不需要文件系统的环境下使用。
    // 把输入数据流压缩,并把压缩后的数据包在一个MemoryStream里返回
    MemoryStream GZipTool.Compress(Stream inputStream)
    GZipTool在解压缩文件的时候也支持进度跟踪
    // 解压指定文件并给以指定名称,跟踪压缩进度,设置缓冲大小
    GZipTool.Decompress(string gZipFileName,     string outputFileName,
                ProgressHandler handler, int bufferSize)
    GZipTool还支持读取gzip文件的描述信息,包括原始文件大小等
    // 把指定gzip文件的描述信息读到一个GZipFileInfo结构里
    GZipFileInfo GZipTool.GetFileInfo(string gZipFileName)
    示例:
    static void Main(string[] args)
    {
        string inputFileName = @"TestFile/Test.doc.gz";
       
        GZipFileInfo fileInfo = GZipTool.GetFileInfo(inputFileName);
        Console.WriteLine("GZip File Name: {0}", inputFileName);
        // 输出原始文件大小
        Console.WriteLine("Original File Size: {0}", fileInfo.OriginalFileSize);
        Console.WriteLine("Finished");
        Console.ReadLine();
    }
  • 相关阅读:
    MySQL数据库的常用命令
    函数返回 局部变量问题
    几种网络I/O模型
    socket的select模型【摘】
    Linux Bash Shell入门教程【转载】
    Shell学习【转】
    unicode 2 utf8 [转]
    linux下多线程的创建与等待详解 【转载】
    运算(93&-8)的结果
    一道腾讯的面试题,关于a和&a
  • 原文地址:https://www.cnblogs.com/topguntopgun/p/3987938.html
Copyright © 2011-2022 走看看