zoukankan      html  css  js  c++  java
  • 利用 JAVA 操作 EXCEL 文件

    简介: 使用 Windows 操作系统的朋友对 Excel(电子表格)一定不会陌生,但是要使用 Java 语言来操纵 Excel 文件并不是一件容易的事。在 Web 应用日益盛行的今天,通过 Web 来操作 Excel 文件的需求越来越强烈,目前较为流行的操作是在 JSP 或 Servlet 中创建一个 CSV (comma separated values)文件,并将这个文件以 MIME,text/csv 类型返回给浏览器,接着浏览器调用 Excel 并且显示 CSV 文件。这样只是说可以访问到 Excel 文件,但是还不能真正的操纵 Excel 文件,本文将给大家一个惊喜,向大家介绍一个开放源码项目,Java Excel API,使用它大家就可以方便地操纵 Excel 文件了。

    本文的标签:  excel, java, java编程, 利用, 操作, 文件(转的)

    发布日期: 2003 年 1 月 11 日 
    级别: 初级 
    访问情况 22433 次浏览 
    建议: 0 (添加评论)

    1 star2 stars3 stars4 stars5 stars 平均分 (共 35 个评分 )

    JAVA EXCEL API 简介

    Java Excel 是一开放源码项目,通过它 Java 开发人员可以读取 Excel 文件的内容、创建新的 Excel 文件、更新已经存在的 Excel 文件。使用该 API 非 Windows 操作系统也可以通过纯 Java 应用来处理 Excel 数据表。因为是使用 Java 编写的,所以我们在 Web 应用中可以通过 JSP、Servlet 来调用 API 实现对 Excel 数据表的访问。

    现在发布的稳定版本是 V2.0,提供以下功能:

    • 从 Excel 95、97、2000 等格式的文件中读取数据;
    • 读取 Excel 公式(可以读取 Excel 97 以后的公式);
    • 生成 Excel 数据表(格式为 Excel 97);
    • 支持字体、数字、日期的格式化;
    • 支持单元格的阴影操作,以及颜色操作;
    • 修改已经存在的数据表;

    现在还不支持以下功能,但不久就会提供了:

    1. 不能够读取图表信息;
    2. 可以读,但是不能生成公式,任何类型公式最后的计算值都可以读出;

    应用示例

    1 从 Excel 文件读取数据表

    Java Excel API 既可以从本地文件系统的一个文件 (.xls),也可以从输入流中读取 Excel 数据表。读取 Excel 数据表的第一步是创建 Workbook( 术语:工作薄 ),下面的代码片段举例说明了应该如何操作:( 完整代码见 ExcelReading.java)

     import java.io.*;
     import jxl.*;
    … … … …
     try
     {
     // 构建 Workbook 对象 , 只读 Workbook 对象
    	 // 直接从本地文件创建 Workbook
     // 从输入流创建 Workbook
        InputStream is = new FileInputStream(sourcefile);
        jxl.Workbook rwb = Workbook.getWorkbook(is);
     }
     catch (Exception e)
     {
    	 e.printStackTrace();
     }
    

    一旦创建了 Workbook,我们就可以通过它来访问 Excel Sheet( 术语:工作表 )。参考下面的代码片段:

     // 获取第一张 Sheet 表
     Sheet rs = rwb.getSheet(0);
    

    我们既可能通过 Sheet 的名称来访问它,也可以通过下标来访问它。如果通过下标来访问的话,要注意的一点是下标从 0 开始,就像数组一样。

    一旦得到了 Sheet,我们就可以通过它来访问 Excel Cell( 术语:单元格 )。参考下面的代码片段:

     // 获取第一行,第一列的值
     Cell c00 = rs.getCell(0, 0);
     String strc00 = c00.getContents();
     // 获取第一行,第二列的值
     Cell c10 = rs.getCell(1, 0);
     String strc10 = c10.getContents();
     // 获取第二行,第二列的值
     Cell c11 = rs.getCell(1, 1);
     String strc11 = c11.getContents();
     System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType());
     System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType());
     System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType());
    

    如果仅仅是取得 Cell 的值,我们可以方便地通过 getContents() 方法,它可以将任何类型的 Cell 值都作为一个字符串返回。示例代码中 Cell(0, 0) 是文本型,Cell(1, 0) 是数字型,Cell(1,1) 是日期型,通过 getContents(),三种类型的返回值都是字符型。

    如果有需要知道 Cell 内容的确切类型,API 也提供了一系列的方法。参考下面的代码片段:

     String strc00 = null;
     double strc10 = 0.00;
     Date strc11 = null;
     Cell c00 = rs.getCell(0, 0);
     Cell c10 = rs.getCell(1, 0);
     Cell c11 = rs.getCell(1, 1);
     if(c00.getType() == CellType.LABEL)
     {
     LabelCell labelc00 = (LabelCell)c00;
     strc00 = labelc00.getString();
     }
     if(c10.getType() == CellType.NUMBER)
     {
    	 NmberCell numc10 = (NumberCell)c10;
     strc10 = numc10.getValue();
     }
     if(c11.getType() == CellType.DATE)
     {
     DateCell datec11 = (DateCell)c11;
     strc11 = datec11.getDate();
     }
     System.out.println("Cell(0, 0)" + " value : " + strc00 + "; type : " + c00.getType());
     System.out.println("Cell(1, 0)" + " value : " + strc10 + "; type : " + c10.getType());
     System.out.println("Cell(1, 1)" + " value : " + strc11 + "; type : " + c11.getType());
    

    在得到 Cell 对象后,通过 getType() 方法可以获得该单元格的类型,然后与 API 提供的基本类型相匹配,强制转换成相应的类型,最后调用相应的取值方法 getXXX(),就可以得到确定类型的值。API 提供了以下基本类型,与 Excel 的数据格式相对应,如下图所示:


     

    每种类型的具体意义,请参见 Java Excel API Document。

    当你完成对 Excel 电子表格数据的处理后,一定要使用 close() 方法来关闭先前创建的对象,以释放读取数据表的过程中所占用的内存空间,在读取大量数据时显得尤为重要。参考如下代码片段:

     // 操作完成时,关闭对象,释放占用的内存空间
     rwb.close();
    

    Java Excel API 提供了许多访问 Excel 数据表的方法,在这里我只简要地介绍几个常用的方法,其它的方法请参考附录中的 Java Excel API Document。

    Workbook 类提供的方法

    1. int getNumberOfSheets() 
    获得工作薄(Workbook)中工作表(Sheet)的个数,示例:

     jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
     int sheets = rwb.getNumberOfSheets();
    

    2. Sheet[] getSheets() 
    返回工作薄(Workbook)中工作表(Sheet)对象数组,示例:

     jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
     Sheet[] sheets = rwb.getSheets();
    

    3. String getVersion() 
    返回正在使用的 API 的版本号,好像是没什么太大的作用。

     jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
     String apiVersion = rwb.getVersion();
    

    Sheet 接口提供的方法

    1) String getName() 
    获取 Sheet 的名称,示例:

     jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
     jxl.Sheet rs = rwb.getSheet(0);
     String sheetName = rs.getName();
    

    2) int getColumns() 
    获取 Sheet 表中所包含的总列数,示例:

     jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
     jxl.Sheet rs = rwb.getSheet(0);
     int rsColumns = rs.getColumns();
    

    3) Cell[] getColumn(int column) 
    获取某一列的所有单元格,返回的是单元格对象数组,示例:

     jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
     jxl.Sheet rs = rwb.getSheet(0);
     Cell[] cell = rs.getColumn(0);
    

    4) int getRows() 
    获取 Sheet 表中所包含的总行数,示例:

     jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
     jxl.Sheet rs = rwb.getSheet(0);
     int rsRows = rs.getRows();
    

    5) Cell[] getRow(int row) 
    获取某一行的所有单元格,返回的是单元格对象数组,示例子:

     jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
     jxl.Sheet rs = rwb.getSheet(0);
     Cell[] cell = rs.getRow(0);
    

    6) Cell getCell(int column, int row) 
    获取指定单元格的对象引用,需要注意的是它的两个参数,第一个是列数,第二个是行数,这与通常的行、列组合有些不同。

     jxl.Workbook rwb = jxl.Workbook.getWorkbook(new File(sourcefile));
     jxl.Sheet rs = rwb.getSheet(0);
     Cell cell = rs.getCell(0, 0);
    

    2 生成新的 Excel 工作薄

    下面的代码主要是向大家介绍如何生成简单的 Excel 工作表,在这里单元格的内容是不带任何修饰的 ( 如:字体,颜色等等 ),所有的内容都作为字符串写入。( 完整代码见 ExcelWriting.java)

    与读取 Excel 工作表相似,首先要使用 Workbook 类的工厂方法创建一个可写入的工作薄 (Workbook) 对象,这里要注意的是,只能通过 API 提供的工厂方法来创建 Workbook,而不能使用 WritableWorkbook 的构造函数,因为类 WritableWorkbook 的构造函数为 protected 类型。示例代码片段如下:

     import java.io.*;
     import jxl.*;
     import jxl.write.*;
    … … … …
     try
     {
     // 构建 Workbook 对象 , 只读 Workbook 对象
     //Method 1:创建可写入的 Excel 工作薄
        jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(new File(targetfile));
     //Method 2:将 WritableWorkbook 直接写入到输出流
     /*
        OutputStream os = new FileOutputStream(targetfile);
        jxl.write.WritableWorkbook wwb = Workbook.createWorkbook(os);
     */
     }
     catch (Exception e)
     {
    	 e.printStackTrace();
     }
    

    API 提供了两种方式来处理可写入的输出流,一种是直接生成本地文件,如果文件名不带全路径的话,缺省的文件会定位在当前目录,如果文件名带有全路径的话,则生成的 Excel 文件则会定位在相应的目录;另外一种是将 Excel 对象直接写入到输出流,例如:用户通过浏览器来访问 Web 服务器,如果 HTTP 头设置正确的话,浏览器自动调用客户端的 Excel 应用程序,来显示动态生成的 Excel 电子表格。

    接下来就是要创建工作表,创建工作表的方法与创建工作薄的方法几乎一样,同样是通过工厂模式方法获得相应的对象,该方法需要两个参数,一个是工作表的名称,另一个是工作表在工作薄中的位置,参考下面的代码片段:

     // 创建 Excel 工作表
     jxl.write.WritableSheet ws = wwb.createSheet("Test Sheet 1", 0);
    

    "这锅也支好了,材料也准备齐全了,可以开始下锅了!",现在要做的只是实例化 API 所提供的 Excel 基本数据类型,并将它们添加到工作表中就可以了,参考下面的代码片段:

     //1. 添加 Label 对象
     jxl.write.Label labelC = new jxl.write.Label(0, 0, "This is a Label cell");
     ws.addCell(labelC);
     // 添加带有字型 Formatting 的对象
     jxl.write.WritableFont wf = new jxl.write.WritableFont(WritableFont.TIMES, 18,
     WritableFont.BOLD, true);
     jxl.write.WritableCellFormat wcfF = new jxl.write.WritableCellFormat(wf);
     jxl.write.Label labelCF = new jxl.write.Label(1, 0, "This is a Label Cell", wcfF);
     ws.addCell(labelCF);
     // 添加带有字体颜色 Formatting 的对象
     jxl.write.WritableFont wfc = new jxl.write.WritableFont(WritableFont.ARIAL, 10,
     WritableFont.NO_BOLD, false,
     UnderlineStyle.NO_UNDERLINE, jxl.format.Colour.RED);
     jxl.write.WritableCellFormat wcfFC = new jxl.write.WritableCellFormat(wfc);
     jxl.write.Label labelCFC = new jxl.write.Label(1, 0, "This is a Label Cell", wcfFC);
     ws.addCell(labelCF);
     //2. 添加 Number 对象
     jxl.write.Number labelN = new jxl.write.Number(0, 1, 3.1415926);
     ws.addCell(labelN);
     // 添加带有 formatting 的 Number 对象
     jxl.write.NumberFormat nf = new jxl.write.NumberFormat("#.##");
     jxl.write.WritableCellFormat wcfN = new jxl.write.WritableCellFormat(nf);
     jxl.write.Number labelNF = new jxl.write.Number(1, 1, 3.1415926, wcfN);
     ws.addCell(labelNF);
     //3. 添加 Boolean 对象
     jxl.write.Boolean labelB = new jxl.write.Boolean(0, 2, false);
     ws.addCell(labelB);
     //4. 添加 DateTime 对象
     jxl.write.DateTime labelDT = new jxl.write.DateTime(0, 3, new java.util.Date());
     ws.addCell(labelDT);
     // 添加带有 formatting 的 DateFormat 对象
     jxl.write.DateFormat df = new jxl.write.DateFormat("dd MM yyyy hh:mm:ss");
     jxl.write.WritableCellFormat wcfDF = new jxl.write.WritableCellFormat(df);
     jxl.write.DateTime labelDTF = new jxl.write.DateTime(1, 3, new java.util.Date(),
     wcfDF);
     ws.addCell(labelDTF);
    

    这里有两点大家要引起大家的注意。第一点,在构造单元格时,单元格在工作表中的位置就已经确定了。一旦创建后,单元格的位置是不能够变更的,尽管单元格的内容是可以改变的。第二点,单元格的定位是按照下面这样的规律 (column, row),而且下标都是从 0 开始,例如,A1 被存储在 (0, 0),B1 被存储在 (1, 0)。

    最后,不要忘记关闭打开的 Excel 工作薄对象,以释放占用的内存,参见下面的代码片段:

     // 写入 Exel 工作表
     wwb.write();
     // 关闭 Excel 工作薄对象
     wwb.close();
    

    这可能与读取 Excel 文件的操作有少少不同,在关闭 Excel 对象之前,你必须要先调用 write() 方法,因为先前的操作都是存储在缓存中的,所以要通过该方法将操作的内容保存在文件中。如果你先关闭了 Excel 对象,那么只能得到一张空的工作薄了。

    3 拷贝、更新 Excel 工作薄

    接下来简要介绍一下如何更新一个已经存在的工作薄,主要是下面二步操作,第一步是构造只读的 Excel 工作薄,第二步是利用已经创建的 Excel 工作薄创建新的可写入的 Excel 工作薄,参考下面的代码片段:( 完整代码见 ExcelModifying.java)

     // 创建只读的 Excel 工作薄的对象
     jxl.Workbook rw = jxl.Workbook.getWorkbook(new File(sourcefile));
     // 创建可写入的 Excel 工作薄对象
     jxl.write.WritableWorkbook  wwb = Workbook.createWorkbook(new File(targetfile), rw);
    
     // 读取第一张工作表
     jxl.write.WritableSheet ws = wwb.getSheet(0);
     // 获得第一个单元格对象
     jxl.write.WritableCell wc = ws.getWritableCell(0, 0);
    
     // 判断单元格的类型 , 做出相应的转化
     if(wc.getType() == CellType.LABEL)
     {
     Label l = (Label)wc;
        l.setString("The value has been modified.");
     }
     // 写入 Excel 对象
     wwb.write();
     // 关闭可写入的 Excel 对象
     wwb.close();
     // 关闭只读的 Excel 对象
     rw.close();
    

    之所以使用这种方式构建 Excel 对象,完全是因为效率的原因,因为上面的示例才是 API 的主要应用。为了提高性能,在读取工作表时,与数据相关的一些输出信息,所有的格式信息,如:字体、颜色等等,是不被处理的,因为我们的目的是获得行数据的值,既使没有了修饰,也不会对行数据的值产生什么影响。唯一的不利之处就是,在内存中会同时保存两个同样的工作表,这样当工作表体积比较大时,会占用相当大的内存,但现在好像内存的大小并不是什么关键因素了。

    一旦获得了可写入的工作表对象,我们就可以对单元格对象进行更新的操作了,在这里我们不必调用 API 提供的 add() 方法,因为单元格已经于工作表当中,所以我们只需要调用相应的 setXXX() 方法,就可以完成更新的操作了。

    尽单元格原有的格式化修饰是不能去掉的,我们还是可以将新的单元格修饰加上去,以使单元格的内容以不同的形式表现。

    新生成的工作表对象是可写入的,我们除了更新原有的单元格外,还可以添加新的单元格到工作表中,这与示例 2 的操作是完全一样的。

    最后,不要忘记调用 write() 方法,将更新的内容写入到文件中,然后关闭工作薄对象,这里有两个工作薄对象要关闭,一个是只读的,另外一个是可写入的。

    小结

    本文只是对 Java Excel API 中常用的方法作了介绍,要想更详尽地了解 API,请大家参考 API 文档,或源代码。Java Excel API 是一个开放源码项目,请大家关注它的最新进展,有兴趣的朋友也可以申请加入这个项目,或者是提出宝贵的意见。


    参考资料

    1. Java Excel API 文档
    2. http://www.andykhan.com/jexcelapi/

    摘自:http://www.ibm.com/developerworks/cn/java/l-javaExcel/

  • 相关阅读:
    【myEcplise2015】导入喜欢的主题
    【SVN】删除SVN上的历史资源路径和SVN上的历史用户信息
    【Linux】linux命令大全
    【Linux】在虚拟机上安装CentOS7
    Spring MVC+Mybatis 多数据源配置
    Spring 加载类路径外的资源文件
    OkHttp使用详解
    在虚拟机搭建JStrom
    在Windows下搭建RocketMQ
    解决confluence的乱码问题
  • 原文地址:https://www.cnblogs.com/xd502djj/p/2114062.html
Copyright © 2011-2022 走看看