zoukankan      html  css  js  c++  java
  • PHP海量excel数据导出方案解决 xlswriter性能测试

    2021年5月28日19:29:20

    xlswriter 中文官方网站 https://xlswriter-docs.viest.me/zh-cn 

    windows10 环境laravel8 mysql8 

    pecl扩展目前支持到php8

    http://pecl.php.net/package/xlswriter

    作者提供了dll,方便windows开发环境测试,挺好的

     第一次执行会慢一点,第二次就更快一点,服务器上开了opcache估计会更快一点

    public function test(Request $request)
        {
            $start_time = date('Y-m-d H:i:s');
    
            ini_set('memory_limit', '1024m');
            $config = [
                'path' => public_path() . '/upload' // xlsx文件保存路径
            ];
            $excel = new Excel($config);
    
            $textFile = $excel->fileName("free.xlsx")->header(['id', 'name', 'phone', 'source', 'province_name', 'city_name', 'data_time', 'user_id', 'user_nickname', 'register_time', 'up_user_id', 'store_name', 'is_pull_new']);
            //大约11万数据
            foreach (BrokerMemberData::get() as $k => $v) {
    
                $textFile->insertText($k+1, 0, $v->id);
                $textFile->insertText($k+1, 1, $v->name);
                $textFile->insertText($k+1, 2, $v->phone);
                $textFile->insertText($k+1, 3, $v->source);
                $textFile->insertText($k+1, 4, $v->province_name);
                $textFile->insertText($k+1, 5, $v->city_name);
                $textFile->insertText($k+1, 6, $v->data_time);
                $textFile->insertText($k+1, 7, $v->user_id);
                $textFile->insertText($k+1, 8, $v->user_nickname);
                $textFile->insertText($k+1, 9, $v->register_time);
                $textFile->insertText($k+1, 10, $v->up_user_id);
                $textFile->insertText($k+1, 11, $v->store_name);
                $textFile->insertText($k+1, 12, $v->is_pull_new);
            }
    
            $filePath = $textFile->output();
    
            p(BrokerMemberData::count());
            p('执行成功 开始时间' . $start_time . '结束时间' . date('Y-m-d H:i:s'));
            p($filePath);
        }

    执行结果

    115135
    执行成功 开始时间2021-05-29 10:45:04结束时间2021-05-29 10:45:10
    D:phpstudy_proWWWmcpublic/upload/free.xlsx

    orm里面使用
         BrokerMemberData::where('id', '>', 0)->chunkById(10000, function ($list) use ($textFile) {
                foreach ($list as $k => $v) {
    
                    $textFile->insertText($v->id + 1, 0, $v->id);
                    $textFile->insertText($v->id + 1, 1, $v->name);
                    $textFile->insertText($v->id + 1, 2, $v->phone);
                    $textFile->insertText($v->id + 1, 3, $v->source);
                    $textFile->insertText($v->id + 1, 4, $v->province_name);
                    $textFile->insertText($v->id + 1, 5, $v->city_name);
                    $textFile->insertText($v->id + 1, 6, $v->data_time);
                    $textFile->insertText($v->id + 1, 7, $v->user_id);
                    $textFile->insertText($v->id + 1, 8, $v->user_nickname);
                    $textFile->insertText($v->id + 1, 9, $v->register_time);
                    $textFile->insertText($v->id + 1, 10, $v->up_user_id);
                    $textFile->insertText($v->id + 1, 11, $v->store_name);
                    $textFile->insertText($v->id + 1, 12, $v->is_pull_new);
    //                pp($textFile);
    //                p($t++);
                }
            });


    每次跑20000
    D:phpstudy_proWWWmc>php artisan Zx 初始: 17.759658813477MB <pre>115135</pre><pre>执行成功 开始时间2021-05-29 19:09:18结束时间2021-05-29 19:09:34</pre><pre>D:phpstudy_proWWWmcpublic/upload/free.xlsx</pre>释放: 19.283096313477MB 峰值: 53.145240783691MB
    15000 D
    :phpstudy_proWWWmc>php artisan Zx 初始: 17.759658813477MB <pre>115135</pre><pre>执行成功 开始时间2021-05-29 19:09:53结束时间2021-05-29 19:10:08</pre><pre>D:phpstudy_proWWWmcpublic/upload/free.xlsx</pre>释放: 19.287315368652MB 峰值: 37.001892089844MB
    8000 D
    :phpstudy_proWWWmc>php artisan Zx 初始: 17.759658813477MB <pre>115135</pre><pre>执行成功 开始时间2021-05-29 19:10:26结束时间2021-05-29 19:10:46</pre><pre>D:phpstudy_proWWWmcpublic/upload/free.xlsx</pre>释放: 19.13597869873MB 峰值: 20.823844909668MB
    10000 D
    :phpstudy_proWWWmc>php artisan Zx 初始: 17.759658813477MB <pre>115135</pre><pre>执行成功 开始时间2021-05-29 19:10:56结束时间2021-05-29 19:11:11</pre><pre>D:phpstudy_proWWWmcpublic/upload/free.xlsx</pre>释放: 19.285507202148MB 峰值: 42.986419677734MB

     其他方案:

    1,csv , 不段的刷新缓冲期,来实现大数据流的导出
    $fp = fopen('php://output', 'a');
    
    // 输出Excel列名信息
    $head = array("电子邮件");
    foreach ($head as $i => $v) {
        // CSV的Excel支持GBK编码,一定要转换,否则乱码
        $head[$i] = iconv('utf-8', 'gbk', $v);
    }
    
    // 将数据通过fputcsv写到文件句柄
    fputcsv($fp, $head);
    
    // 计数器
    $cnt = 0;
    // 每隔$limit行,刷新一下输出buffer,不要太大,也不要太小
    $limit = 100000;
    
    // 逐行取出数据,不浪费内存
    $count = count($email);
    
    for($t=0;$t<$count;$t++) {
    
        $cnt ++;
        if ($limit == $cnt) { //刷新一下输出buffer,防止由于数据过多造成问题
            ob_flush();
            flush();
            $cnt = 0;
        }
        $row[] = $email[$t];
        foreach ($row as $i => $v) {
            $row[$i] = iconv('utf-8', 'gbk', $v);
        }
        fputcsv($fp, $row);
        unset($row);
    }

    这种方案对待简单的excel是可行的,但是需要制作复杂的excel就无能为力

    2,导出操作,不经过php,而是直接交给sql做,使用sql自带的导出功能即可。
    SELECT
        *
    FROM
        table_name 
    INTO OUTFILE 'D:/test.csv' 
    FIELDS TERMINATED BY ',' 
    OPTIONALLY ENCLOSED BY '"' 
    LINES TERMINATED BY '
    ';
    
    SELECT * FROM data_international into outfile 
    'd:/zx.xls';
    
    受影响的行: 436593
    时间: 0.523s
    
    TRUNCATE TABLE data_international;<br>
    LOAD DATA INFILE 
    'd:/zx.xls' 
    INTO TABLE data_international;
    
    受影响的行: 436593
    时间: 2.453s
    复杂一些的sql参考 https
    ://www.cnblogs.com/zx-admin/p/5174796.html

    3,异步任务

    吧excel导出的任务,写入到一个队列,这个可以是redis的队列,也可以是mq的生产队列,

    然后写一个消费队列是消费,在cli模式下执行不担心请求超时,然后执行完成,写消息返回给用,可以使用socket通知用户,也可以写一条mysql记录,告诉用户下载地址

    很多需要大数量导出的系统都是采用这个方案

    但是这个方案有个缺点就是海量数据导出很容易,内存溢出

    4,数据流,边刷出文件流,边提供下下载,还是容易超时

    5,分文件拆分处理生成 file1.xls,file2.xls,file3.xls,然后合并,减少内存和处问题,但是这个依然会出现硬盘和内存飙升

    6,

    QQ群 247823727 博客文件如果不能下载请进群下载
    如果公司项目有技术瓶颈问题,如有需要,请联系我,提供技术服务 QQ: 903464207
  • 相关阅读:
    大数据面试题题库
    IDEA下通过Git实现代码管理
    使用QJM实现HDFS的HA配置
    1、HDFS分布式文件系统
    分析system_call中断处理过程
    由一段代码解析系统调用的原理
    从linux内核代码分析操作系统启动过程
    一个简单的时间片轮转多道程序内核
    从一段代码的汇编看计算机的工作原理
    九度OJ1468
  • 原文地址:https://www.cnblogs.com/zx-admin/p/14823615.html
Copyright © 2011-2022 走看看