zoukankan      html  css  js  c++  java
  • POI使用汇总

    POI它是apache下一步行为office有关格源工具。我们近期在使用这个框架实现Excel格式数据的导入和导出功能。这里进行一个使用总结。POI提供两种读写API模型:事件模型(eventmodel)和用户模型(usermodel)。
          事件模型。基于流(stream)的方式实现,使用sax(simple api for XML)模型进行xml内容解析。对CPU和内存的消耗小,但使用复杂,且无法进行写操作。
           用户模型,基于内存树(memory tree)的方式实现,使用DOM进行excel的解析,对CPU和内存的消耗大,但可以以面向对象的方式进行操作。使用简便,可读可写。
           对于2007版excel。POI还提供了可缓存流的用户模型API,使用滑动窗体(sliding window)的方法控制缓存区的大小。实现对海量数据的读写。我在我的笔记本(i5双核,4G内存)上使用POI官方的样例測试10列*6万行的写入效率。当缓存为100行的时候仅仅须要5秒。确实快。详细API的特性能够參考下面表格(来源于POI官网):

           非常明显,2007版excel在读写方面POI做的更好,2003版在海量数据写入方面支持不够。所以在设计系统的导入、导出功能时,应该优先考虑2007版。

            在系统导入、导出功能优化的过程中,应该遵守“先明白性能瓶颈,再分析、确定、实施调优方案”的思路,不要想当然的以为性能就出如今POI上。非常有可能性问题就出现准备数据的过程中(如查询数据、转换格式)。理清思路。不盲目推測,是性能优化的首要步骤,谨记!


    版权声明:本文博客原创文章。博客,未经同意,不得转载。

  • 相关阅读:
    pandas的Categorical方法
    LightBGM之train
    LightBGM之Dataset
    pandas的replace方法
    python的tqdm模块
    pandas的merge方法
    pandas的drop函数
    各种服务器建议配置
    thymeleaf:访问静态方法
    The project cannot be built until its prerequisite base-service is built. Cleaning and building all projects is recommended
  • 原文地址:https://www.cnblogs.com/bhlsheji/p/4722256.html
Copyright © 2011-2022 走看看