zoukankan      html  css  js  c++  java
  • Java读取Excel数据

    Java读取Excel数据,解析文本并格式化输出

    Java读取Excel数据,解析文本并格式化输出

    Java读取Excel数据,解析文本并格式化输出

    下图是excel文件的路径和文件名

    下图是excel文件里面的内容

    下面是Java读取Excel数据的代码

    package excel_driver;
    
    import java.util.List;
    import java.io.FileInputStream;
    import java.io.InputStream;
    import java.util.ArrayList;
    
    import org.apache.poi.xssf.usermodel.XSSFCell;
    import org.apache.poi.xssf.usermodel.XSSFRow;
    import org.apache.poi.xssf.usermodel.XSSFSheet;
    import org.apache.poi.xssf.usermodel.XSSFWorkbook;
    
    public class excel_driver {
        private static List<List<String>> readXlsx(String path) throws Exception {
            InputStream is = new FileInputStream(path);
            XSSFWorkbook xssfWorkbook = new XSSFWorkbook(is);
            List<List<String>> result =new ArrayList<List<String>>();
            //循环每一页,并处理当前循环页
            //for(XSSFSheet xssfSheet : xssfWorkbook){
            for(int numSheet=0; numSheet < xssfWorkbook.getNumberOfSheets(); numSheet++){
                XSSFSheet xssfSheet = xssfWorkbook.getSheetAt(numSheet);
                if (xssfSheet==null)
                    continue;
                //处理当前页,循环读取每一行
                for(int rowNum=1; rowNum<=xssfSheet.getLastRowNum();rowNum++){
                    XSSFRow xssfRow = xssfSheet.getRow(rowNum);
                    
                    int minColIx = xssfRow.getFirstCellNum();
                    int maxColIx = xssfRow.getLastCellNum();
                    List<String> rowList = new ArrayList<String>();
    //                System.out.println("	");
                    //遍历该行获取处理每个cell元素
                    for(int colIx=minColIx;colIx<maxColIx; colIx++){
                        XSSFCell cell= xssfRow.getCell(colIx);
    //                    System.out.println("	");
                        if (cell==null){
    //                        System.out.println("	");
                            continue;
                        }
                        
                        rowList.add(getString.getStringVal(cell));
    //                    System.out.println("	");
                    }
    
                    result.add(rowList);
                }
            }
            return result;
        }
        
        public static void main(String[] args) throws Exception {
            List<List<String>> a = readXlsx("C:\Users\chenjia\Desktop\excel_driver.xlsx");
    //        for (int i = 0; i < a.size(); i++) {
    //            System.out.println(a.[i]);
    //        }
            for(List list:a)
            {
                System.out.println(list);
            }
            System.out.println(a);
            System.out.println(a.size());
    //        System.out.println(a.[1]);
        }
        
    
    }
    package excel_driver;
    
    import org.apache.poi.ss.usermodel.Cell;
    import org.apache.poi.xssf.usermodel.XSSFCell;
    
    public class getString {
        public static String getStringVal (XSSFCell cell){
            switch (cell.getCellType()) {
            case Cell.CELL_TYPE_BOOLEAN:
                return cell.getBooleanCellValue() ? "TRUE" : "FALSE";
            case Cell.CELL_TYPE_FORMULA://公式格式
                return cell.getCellFormula();
            case Cell.CELL_TYPE_NUMERIC://数字格式
                cell.setCellType(Cell.CELL_TYPE_STRING);
                return cell.getStringCellValue();
            case Cell.CELL_TYPE_STRING:
                return cell.getStringCellValue();
            
    
            default:
                return "????";
            }
        }
    
    }

    运行结果是:

    [张三, 111111, 会计1班, 20150505, 13113131313, 4111]
    [李四, 222222, 文法2班, 20160606, 15215215212, 4222]
    [王五, 3333333, 英语3班, 20170707, 13313313333, 4333]
    [[张三, 111111, 会计1班, 20150505, 13113131313, 4111], [李四, 222222, 文法2班, 20160606, 15215215212, 4222], [王五, 3333333, 英语3班, 20170707, 13313313333, 4333]]
    3

    下面是原文章:

    相关技术

    使用的POI解析Excel需要使用的jar包 
    这里写图片描述 
    注(使用的maven.我就添加了右边的两个依赖就可以了)

    分析

    解析Excel首先就要解析Excel的结构.然后用面向对象的思想分析一下 
    这里写图片描述 
    这是一个excel文件.下面我们就来分析一下如果让你写这个poi框架,那么你会怎么设计. 
    1. 首先要有一个对象表示这整个Excel文件. 
    2. 可是这个excel文件中有好多页.Sheet1, Sheet2等等,所以我们还需要一个对象表示页. 
    3. 在页中,有行,所以还需要一个对象表示行. 
    4. 在行中,最后细分到格cell. 
    5. 格cell中数据还有好多类型.有字符串,数字,时间等等.

    POI中的对象与excel对象的对应

    excel文件就有多种类型了.后缀有 xls 与 xlsx 
    这里写图片描述 
    所以对于不同类型的文件,就需要使用不同的poi中的对象了. 
    1. 如果你要解析的是xls文件 
    这里写图片描述 
    从代码不难发现,这里的处理逻辑是 
    1>. 先用inputstream获取excel文件的io流 
    2>. 然后创建一个内存中的excel文件HSSFWorkbook类型对象.这个对象表示了整个excel文件. 
    3>. 对这个excel文件的每页做循环处理 
    4>. 对每页中的每行做循环处理. 
    5>. 对每行中的每个单元格做做处理,获取这个单元格的值. 
    6>. 把这行的结果添加到一个List数组中. 
    7>. 把每行的结果添加到最后的总结果中. 
    8>. 解析完以后就获取了一个List< List < String > > 类型的对象了. 
    2. 如果你要处理xlsx类型的文件则 
    这里写图片描述 
    和上面一样,我就不说了.

    存在的问题

    其实有时候我们希望得到的数据就是excel中的数据,可是最后发现结果不理想 
    如果你的excel中的数据是数字,你会发现Java中对应的变成了科学计数法的. 
    所以在获取值的时候就要做一些特殊处理. 
    这样就能保证获取的值是我想要的值. 
    网上的做法是对于数值类型的数据格式化,获取自己想要的结果. 
    其实也没有那么麻烦.我在做的时候突然想到了一种处理解决方案.供参考 
    我们看一下poi中对于的toString()方法 
    这里写图片描述 
    该方法是poi的方法,从源码中我们可以发现,该处理流程是 
    1. 获取单元格的类型 
    2. 根据类型格式化数据并输出.这不一下子就造成了很多不是我们想要的. 
    所以我们就要改造一下这个方法例如这样 
    这里写图片描述 
    我的做法是这样的 
    1. 对于不熟悉的类型,或者为空则返回”” 控制串. 
    2.如果是数字,则修改单元格类型为String,然后返回String.这样就保证数字不被格式化了. 
    3. 虽然不知道这么做有什么后果,可是成功了. 
    这里写图片描述

  • 相关阅读:
    pandas 排序替换总结
    pandas 布尔值筛选总结
    矩阵的常见4中分解总结
    六,投资管理流程有投资者需求
    五,另类投资
    四 衍生工具
    使用webOffice开源js的一些先修知识
    文档填充遇到一些问题
    Swagger的配置与使用
    彻底刷新chrome浏览器的操作
  • 原文地址:https://www.cnblogs.com/111testing/p/6376388.html
Copyright © 2011-2022 走看看