zoukankan      html  css  js  c++  java
  • Java读取批量Excel文件,并转化为List<Map<String,String>>

    1.首先基础知识:
    一 :简介

    开发中经常会设计到excel的处理,如导出Excel,导入Excel到数据库中,操作Excel目前有两个框架,一个是apache 的poi, 另一个是 Java Excel

    Apache POI 简介是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office(Excel、WORD、PowerPoint、Visio等)格式档案读和写的功能。POI为“Poor Obfuscation Implementation”的首字母缩写,意为“可怜的模糊实现”。

    官方主页: http://poi.apache.org/index.html

    API文档: http://poi.apache.org/apidocs/index.html

    Java Excel是一开放源码项目,通过它Java开发人员可以读取Excel文件的内容、创建新的Excel文件、更新已经存在的Excel文件。jxl 由于其小巧 易用的特点, 逐渐已经取代了 POI-excel的地位, 成为了越来越多的java开发人员生成excel文件的首选。

    由于apache poi 在项目中用的比较多,本篇博客只讲解apache poi,不讲jxl

    二:Apache POI常用的类

    HSSF - 提供读写Microsoft Excel XLS格式档案的功能。

    XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。

    HWPF - 提供读写Microsoft Word DOC97格式档案的功能。

    XWPF - 提供读写Microsoft Word DOC2003格式档案的功能。

    HSLF - 提供读写Microsoft PowerPoint格式档案的功能。

    HDGF - 提供读Microsoft Visio格式档案的功能。

    HPBF - 提供读Microsoft Publisher格式档案的功能。

    HSMF - 提供读Microsoft Outlook格式档案的功能。

    在开发中我们经常使用HSSF用来操作Excel处理表格数据,对于其它的不经常使用。

    HSSF 是Horrible SpreadSheet Format的缩写,通过HSSF,你可以用纯Java代码来读取、写入、修改Excel文件。HSSF 为读取操作提供了两类API:usermodel和eventusermodel,即“用户模型”和“事件-用户模型”。

    常用的类和方法

    HSSFWorkbook :工作簿,代表一个excel的整个文档

    HSSFWorkbook(); // 创建一个新的工作簿

    HSSFWorkbook(InputStream inputStream); // 创建一个关联输入流的工作簿,可以将一个excel文件封装成工作簿

    HSSFSheet createSheet(String sheetname); 创建一个新的Sheet

    HSSFSheet getSheet(String sheetName); 通过名称获取Sheet

    HSSFSheet getSheetAt(int index); // 通过索引获取Sheet,索引从0开始

    HSSFCellStyle createCellStyle(); 创建单元格样式

    int getNumberOfSheets(); 获取sheet的个数

    setActiveSheet(int index); 设置默认选中的工作表

    write();

    write(File newFile);

    write(OutputStream stream);

    HSSFSheet:工作表

    HSSFRow createRow(int rownum); 创建新行,需要指定行号,行号从0开始

    HSSFRow getRow(int index); 根据索引获取指定的行

    int addMergedRegion(CellRangeAddress region); 合并单元格

    CellRangeAddress(int firstRow, int lastRow, int firstCol, int lastCol); 单元格范围, 用于合并单元格,需要指定要合并的首行、最后一行、首列、最后一列。

    autoSizeColumn(int column); 自动调整列的宽度来适应内容

    getLastRowNum(); 获取最后的行的索引,没有行或者只有一行的时候返回0

    setColumnWidth(int columnIndex, int width); 设置某一列的宽度,width=字符个数 * 256,例如20个字符的宽度就是20 * 256

    HSSFRow :行

    HSSFCell createCell(int column); 创建新的单元格

    HSSFCell setCell(shot index);

    HSSFCell getCell(shot index);

    setRowStyle(HSSFCellStyle style); 设置行样式

    short getLastCellNum(); 获取最后的单元格号,如果单元格有第一个开始算,lastCellNum就是列的个数

    setHeightInPoints(float height); 设置行的高度

    HSSFCell:单元格

    setCellValue(String value); 设置单元格的值

    setCellType(); 设置单元格类型,如 字符串、数字、布尔等

    setCellStyle(); 设置单元格样式

    String getStringCellValue(); 获取单元格中的字符串值

    setCellStyle(HSSFCellStyle style); 设置单元格样式,例如字体、加粗、格式化

    setCellFormula(String formula); 设置计算公式,计算的结果作为单元格的值,也提供了异常常用的函数,如求和"sum(A1,C1)"、日期函数、字符串相关函数、CountIf和SumIf函数、随机数函数等

    HSSFCellStyle :单元格样式

    setFont(Font font); 为单元格设置字体样式

    setAlignment(HorizontalAlignment align); // 设置水平对齐方式

    setVerticalAlignment(VerticalAlignment align); // 设置垂直对齐方式

    setFillPattern(FillPatternType fp);

    setFillForegroundColor(short bg); 设置前景色

    setFillBackgroundColor(short bg); 设置背景颜色

    HSSFFont:字体,

    setColor(short color); // 设置字体颜色

    setBold(boolean bold); // 设置是否粗体

    setItalic(boolean italic); 设置倾斜

    setUnderline(byte underline); 设置下划线

    HSSFName:名称

    HSSFDataFormat :日期格式化

    HSSFHeader : Sheet的头部

    HSSFFooter :Sheet的尾部

    HSSFDateUtil :日期工具

    HSSFPrintSetup :打印设置

    HSSFErrorConstants:错误信息表

    Excel中的工作簿、工作表、行、单元格中的关系:

    一个Excel文件对应于一个workbook(HSSFWorkbook),

    一个workbook可以有多个sheet(HSSFSheet)组成,

    一个sheet是由多个row(HSSFRow)组成,

    一个row是由多个cell(HSSFCell)组成

    2. 简单实现一个Excel工具类,可以修改引用
    支持读取文件夹,批量解析Excel文件;

    也支持读取单个文件,解析单个Excel文件。

    import org.apache.poi.hssf.usermodel.HSSFWorkbook;
    import org.apache.poi.ss.usermodel.Cell;
    import org.apache.poi.ss.usermodel.Row;
    import org.apache.poi.ss.usermodel.Sheet;
    import org.apache.poi.ss.usermodel.Workbook;
    import org.apache.poi.xssf.usermodel.XSSFWorkbook;
    import org.slf4j.Logger;
    import org.slf4j.LoggerFactory;

    import java.io.File;
    import java.io.FileInputStream;
    import java.util.*;



    public class ExcelUtil {

    private static final Logger logger = LoggerFactory.getLogger(ExcelUtil.class);

    private static final String XLS = ".xls";
    private static final String XLSX = ".xlsx";

    /**
    * 根据文件后缀获取对应Workbook对象
    * @param filePath
    * @param fileType
    * @return
    */
    public static Workbook getWorkbook(String filePath,String fileType){
    Workbook workbook = null;
    FileInputStream fileInputStream = null;
    try{
    File excelFile = new File(filePath);
    if(!excelFile.exists()){
    logger.info(filePath+"文件不存在");
    return null;
    }
    fileInputStream = new FileInputStream(excelFile);
    if(fileType.equalsIgnoreCase(XLS)){
    workbook = new HSSFWorkbook(fileInputStream);
    }else if(fileType.equalsIgnoreCase(XLSX)){
    workbook = new XSSFWorkbook(fileInputStream);
    }
    }catch (Exception e){
    logger.error("获取文件失败",e);
    }finally {
    try {
    if (null != fileInputStream) {
    fileInputStream.close();
    }
    } catch (Exception e) {
    logger.error("关闭数据流出错!错误信息:" , e);
    return null;
    }
    }
    return workbook;
    }

    public static List<Object> readFolder(String filePath){
    int fileNum = 0;
    File file = new File(filePath);
    List<Object> returnList = new ArrayList<>();
    List<Map<String,String>> resultList = new ArrayList<>();
    if (file.exists()) {
    File[] files = file.listFiles();
    for (File file2 : files) {
    if (file2.isFile()) {
    resultList = readExcel(file2.getAbsolutePath());
    returnList.add(resultList);
    fileNum++;
    }
    }
    } else {
    logger.info("文件夹不存在");
    return null;
    }
    logger.info("共有文件:"+fileNum);
    return returnList;
    }

    /**
    * 批量读取Excel文件,返回数据对象
    * @param filePath
    * @return
    */
    public static List<Map<String,String>> readExcel(String filePath){
    Workbook workbook = null;
    List<Map<String,String>> resultList = new ArrayList<>();
    try{
    String fileType = filePath.substring(filePath.lastIndexOf("."));
    workbook = getWorkbook(filePath,fileType);
    if(workbook == null){
    logger.info("获取workbook对象失败");
    return null;
    }
    resultList = analysisExcel(workbook);
    return resultList;
    }catch (Exception e){
    logger.error("读取Excel文件失败"+filePath+"错误信息",e);
    return null;
    }finally {
    try {
    if (null != workbook) {
    workbook.close();
    }
    } catch (Exception e) {
    logger.error("关闭数据流出错!错误信息:" , e);
    return null;
    }

    }
    }

    /**
    * 解析Excel文件,返回数据对象
    * @param workbook
    * @return
    */
    public static List<Map<String,String>> analysisExcel(Workbook workbook){
    List<Map<String,String>> dataList = new ArrayList<>();
    int sheetCount = workbook.getNumberOfSheets();//或取一个Excel中sheet数量
    for(int i = 0 ; i < sheetCount ; i ++){
    Sheet sheet = workbook.getSheetAt(i);

    if(sheet == null){
    continue;
    }
    int firstRowCount = sheet.getFirstRowNum();//获取第一行的序号
    Row firstRow = sheet.getRow(firstRowCount);
    int cellCount = firstRow.getLastCellNum();//获取列数

    List<String> mapKey = new ArrayList<>();

    //获取表头信息,放在List中备用
    if(firstRow == null){
    logger.info("解析Excel失败,在第一行没有读取到任何数据!");
    }else {
    for (int i1 = 0; i1 < cellCount; i1++) {
    mapKey.add(firstRow.getCell(i1).toString());
    }
    }

    //解析每一行数据,构成数据对象
    int rowStart = firstRowCount + 1;
    int rowEnd = sheet.getPhysicalNumberOfRows();
    for(int j = rowStart ; j < rowEnd ; j ++){
    Row row = sheet.getRow(j);//获取对应的row对象

    if(row == null){
    continue;
    }

    Map<String,String> dataMap = new HashMap<>();
    //将每一行数据转化为一个Map对象
    dataMap = convertRowToData(row,cellCount,mapKey);
    dataList.add(dataMap);
    }
    }
    return dataList;
    }

    /**
    * 将每一行数据转化为一个Map对象
    * @param row 行对象
    * @param cellCount 列数
    * @param mapKey 表头Map
    * @return
    */
    public static Map<String,String> convertRowToData(Row row,int cellCount,List<String> mapKey){
    if(mapKey == null){
    logger.info("没有表头信息");
    return null;
    }
    Map<String,String> resultMap = new HashMap<>();
    Cell cell = null;
    for(int i = 0 ; i < cellCount ; i ++){
    cell = row.getCell(i);
    if(cell == null){
    resultMap.put(mapKey.get(i),"");
    }else {
    resultMap.put(mapKey.get(i),getCellVal(cell));
    }
    }
    return resultMap;
    }

    /**
    * 获取单元格的值
    * @param cel
    * @return
    */
    public static String getCellVal(Cell cel) {
    if(cel.getCellType() == Cell.CELL_TYPE_STRING) {
    return cel.getRichStringCellValue().getString();
    }
    if(cel.getCellType() == Cell.CELL_TYPE_NUMERIC) {
    return cel.getNumericCellValue() + "";
    }
    if(cel.getCellType() == Cell.CELL_TYPE_BOOLEAN) {
    return cel.getBooleanCellValue() + "";
    }
    if(cel.getCellType() == Cell.CELL_TYPE_FORMULA) {
    return cel.getCellFormula() + "";
    }
    return cel.toString();
    }


    public static void main(String[] args) {
    //读取文件夹,批量解析Excel文件
    System.out.println("--------------------读取文件夹,批量解析Excel文件-----------------------");
    List<Object> returnList = readFolder("C:\Users\Administrator\Desktop\ExcelTest");
    for(int i = 0 ; i < returnList.size() ; i ++){
    List<Map<String,String>> maps = (List<Map<String,String>>)returnList.get(i);
    for(int j = 0 ; j < maps.size() ; j ++){
    System.out.println(maps.get(j).toString());
    }
    System.out.println("--------------------手打List切割线-----------------------");
    }

    //读取单个文件
    System.out.println("--------------------读取并解析单个文件-----------------------");
    List<Map<String,String>> maps = readExcel("C:\Users\Administrator\Desktop\ExcelTest\学生表.xlsx");
    for(int j = 0 ; j < maps.size() ; j ++){
    System.out.println(maps.get(j).toString());
    }

    }
    运行结果
    文件夹ExcelTest内容:

    学生表内容:

    用户表内容:

    最终运行结果:

    主要参考博客网址:

    https://blog.csdn.net/vbirdbest/article/details/72870714

    https://www.cnblogs.com/Dreamer-1/p/10469430.html

    https://blog.csdn.net/wangwenjie1997/article/details/90933223

    https://blog.csdn.net/summerdirewof/article/details/83822710
    ————————————————
    版权声明:本文为CSDN博主「小白逆流而上」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/baidu_39298625/article/details/105842725

  • 相关阅读:
    单精度和双精度
    @Transactional注解用法
    JPA No EntityManager with actual transaction available for current thread
    上传文件Request Entity Too Large解决办法
    PG数据库查看当前会话和结束会话
    Chrome浏览器记不住密码也不提示保存密码win10
    ARM平台VMP保护开发入门
    关于我
    HDU7072:Boring data structure problem——题解
    HDU7067:Just another board game——题解
  • 原文地址:https://www.cnblogs.com/GarfieldEr007/p/14540744.html
Copyright © 2011-2022 走看看