【Apache POI】Java解析Excel文件并处理合并单元格-粘贴即用

avatar
作者
猴君
阅读量:2

同为牛马,点个赞吧!

一、Excel文件样例

image-20240716153916656

二、工具类源码

import org.apache.poi.ss.usermodel.*; import org.apache.poi.ss.util.CellRangeAddress; import org.apache.poi.xssf.usermodel.XSSFWorkbookFactory; import org.springframework.web.multipart.MultipartFile;  import java.io.IOException; import java.io.InputStream; import java.util.ArrayList; import java.util.HashMap; import java.util.List; import java.util.Map;  /**  * 读取Excel并解析合并单元格,将结果转为Map集合  */ public class ReadMergeCellExcelUtil {      /**      * 读取Excel数据      *      * @param file 上传的Excel文件      * @return 解析后的数据列表      */     public static List<Map<String, String>> readExcelToObj(MultipartFile file) {         List<Map<String, String>> result = new ArrayList<>();         try (InputStream inputStream = file.getInputStream()) {             Workbook workbook = XSSFWorkbookFactory.create(inputStream);             result = readExcel(workbook, 0, 0, 0);         } catch (IOException e) {             e.printStackTrace();         }         return result;     }      /**      * 读取Excel文件      *      * @param workbook      工作簿      * @param sheetIndex    sheet页下标:从0开始      * @param startReadLine 开始读取的行:从0开始      * @param tailLine      去除最后读取的行      * @return 解析后的数据列表      */     private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {         Sheet sheet = workbook.getSheetAt(sheetIndex);         FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();         List<Map<String, String>> result = new ArrayList<>();         for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {             Row row = sheet.getRow(i);             Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);             result.add(rowData);         }         return result;     }      /**      * 解析一行数据      *      * @param sheet           工作表      * @param row             行对象      * @param formulaEvaluator 公式评估器      * @return 解析后的行数据      */     private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {         Map<String, String> rowData = new HashMap<>();         if (row != null) {             int cellIndex = 0;             for (Cell cell : row) {                 String cellValue = getCellValue(sheet, cell, formulaEvaluator);                 rowData.put("field" + cellIndex, cellValue);                 cellIndex++;             }         }         return rowData;     }      /**      * 获取单元格的值      *      * @param sheet           工作表      * @param cell            单元格      * @param formulaEvaluator 公式评估器      * @return 单元格值      */     private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {         if (cell == null) return "";         return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())                 ? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator)                 : getCellStringValue(cell, formulaEvaluator);     }      /**      * 获取合并单元格的值      *      * @param sheet           工作表      * @param row             行号      * @param column          列号      * @param formulaEvaluator 公式评估器      * @return 合并单元格值      */     private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {         for (CellRangeAddress range : sheet.getMergedRegions()) {             if (range.isInRange(row, column)) {                 Row firstRow = sheet.getRow(range.getFirstRow());                 Cell firstCell = firstRow.getCell(range.getFirstColumn());                 return getCellStringValue(firstCell, formulaEvaluator);             }         }         return "";     }      /**      * 判断单元格是否是合并单元格      *      * @param sheet  工作表      * @param row    行下标      * @param column 列下标      * @return 是否是合并单元格      */     private static boolean isMergedRegion(Sheet sheet, int row, int column) {         for (CellRangeAddress range : sheet.getMergedRegions()) {             if (range.isInRange(row, column)) {                 return true;             }         }         return false;     }      /**      * 获取单元格的字符串值      *      * @param cell            单元格      * @param formulaEvaluator 公式评估器      * @return 单元格字符串值      */     private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {         switch (cell.getCellType()) {             case STRING:                 return cell.getStringCellValue();             case BOOLEAN:                 return String.valueOf(cell.getBooleanCellValue());             case FORMULA:                 return formulaEvaluator.evaluate(cell).formatAsString();             case NUMERIC:                 return String.valueOf(cell.getNumericCellValue());             default:                 return "";         }     }  } 

三、解析结果

image-20240716154343627

以下内容基本为废话,大可直接忽略!

四、工具类详解及使用方法

在日常牛马中,处理Excel文件是一项常见且重要的任务。Excel文件通常包含丰富的结构化数据,其中合并单元格的处理尤为复杂。本文将介绍一个名为ReadMergeCellExcelUtil的Java工具,帮助您轻松读取并解析Excel文件,处理合并单元格,并将结果转化为易于操作的Map集合。通过本文,您将学会如何使用该工具,以及理解其背后的实现原理。


准备工作

在开始之前,我们需要确保项目中添加了必要的依赖。这里我们主要使用Apache POI库来处理Excel文件。

Maven依赖:

<dependency>     <groupId>org.apache.poi</groupId>     <artifactId>poi-ooxml</artifactId>     <version>5.0.0</version> </dependency> 

工具功能概述

ReadMergeCellExcelUtil工具的核心功能是解析Excel文件并处理合并单元格。它可以读取Excel文件,将每个单元格的内容存储到Map集合中,并正确处理合并单元格的值。典型的应用场景包括从Excel中读取配置数据、解析报表数据等。


代码详细解读
1. 读取Excel数据

方法:readExcelToObj

该方法用于读取上传的Excel文件,并将其内容解析为一个包含多个Map的列表。每个Map表示Excel文件中的一行数据。

public static List<Map<String, String>> readExcelToObj(MultipartFile file) {     List<Map<String, String>> result = new ArrayList<>();     try (InputStream inputStream = file.getInputStream()) {         Workbook workbook = XSSFWorkbookFactory.create(inputStream);         result = readExcel(workbook, 0, 0, 0);     } catch (IOException e) {         e.printStackTrace();     }     return result; } 

使用try-with-resources确保输入流在使用后正确关闭。

2. 解析Excel文件

方法:readExcel

该方法从工作簿中获取特定工作表,初始化公式评估器,并循环遍历行以解析每一行的数据。

private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {     Sheet sheet = workbook.getSheetAt(sheetIndex);     FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();     List<Map<String, String>> result = new ArrayList<>();     for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {         Row row = sheet.getRow(i);         Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);         result.add(rowData);     }     return result; } 
3. 解析一行数据

方法:parseRow

该方法遍历行中的单元格,并将其值存储到Map中。

private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {     Map<String, String> rowData = new HashMap<>();     if (row != null) {         int cellIndex = 0;         for (Cell cell : row) {             String cellValue = getCellValue(sheet, cell, formulaEvaluator);             rowData.put("field" + cellIndex, cellValue);             cellIndex++;         }     }     return rowData; } 
4. 获取单元格值

方法:getCellValue

该方法根据单元格类型获取其值,并处理合并单元格。

private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {     if (cell == null) return "";     return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())             ? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator)             : getCellStringValue(cell, formulaEvaluator); } 
5. 获取合并单元格值

方法:getMergedRegionValue

该方法查找并获取合并单元格的值。

private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {     for (CellRangeAddress range : sheet.getMergedRegions()) {         if (range.isInRange(row, column)) {             Row firstRow = sheet.getRow(range.getFirstRow());             Cell firstCell = firstRow.getCell(range.getFirstColumn());             return getCellStringValue(firstCell, formulaEvaluator);         }     }     return ""; } 
6. 判断单元格是否是合并单元格

方法:isMergedRegion

该方法检查指定单元格是否属于合并区域。

private static boolean isMergedRegion(Sheet sheet, int row, int column) {     for (CellRangeAddress range : sheet.getMergedRegions()) {         if (range.isInRange(row, column)) {             return true;         }     }     return false; } 
7. 获取单元格的字符串值

方法:getCellStringValue

该方法根据单元格类型获取字符串值,并评估公式单元格。

private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {     switch (cell.getCellType()) {         case STRING:             return cell.getStringCellValue();         case BOOLEAN:             return String.valueOf(cell.getBooleanCellValue());         case FORMULA:             return formulaEvaluator.evaluate(cell).formatAsString();         case NUMERIC:             return String.valueOf(cell.getNumericCellValue());         default:             return "";     } } 

示例代码

以下是一个完整的示例,展示如何使用ReadMergeCellExcelUtil工具读取并解析Excel文件:

import org.springframework.web.multipart.MultipartFile; import java.util.List; import java.util.Map;  public class ExcelParserExample {      public static void main(String[] args) {         // 假设有一个MultipartFile类型的Excel文件对象file         MultipartFile file = ...;          // 使用工具类解析Excel文件         List<Map<String, String>> parsedData = ReadMergeCellExcelUtil.readExcelToObj(file);          // 打印解析结果         for (Map<String, String> rowData : parsedData) {             System.out.println(rowData);         }     } } 

运行结果将是Excel文件的解析数据,每一行数据以Map的形式存储。


常见问题与解决方案
  1. 空单元格处理:确保在解析单元格时处理空单元格,避免空指针异常。
  2. 大型Excel文件处理:对于大型Excel文件,可以考虑使用流式读取方法,以减少内存消耗。

结论

ReadMergeCellExcelUtil工具提供了一种简单而有效的方式来解析Excel文件并处理合并单元格。通过使用Apache POI库,我们可以轻松处理各种复杂的Excel文件格式。未来,可以考虑进一步优化性能,并添加更多功能,如支持多种文件格式和自定义数据解析规则。

Over!

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!