同为牛马,点个赞吧!
一、Excel文件样例
二、工具类源码
import org.apache.poi.ss.usermodel.*; import org.apache.poi.ss.util.CellRangeAddress; import org.apache.poi.xssf.usermodel.XSSFWorkbookFactory; import org.springframework.web.multipart.MultipartFile; import java.io.IOException; import java.io.InputStream; import java.util.ArrayList; import java.util.HashMap; import java.util.List; import java.util.Map; /** * 读取Excel并解析合并单元格,将结果转为Map集合 */ public class ReadMergeCellExcelUtil { /** * 读取Excel数据 * * @param file 上传的Excel文件 * @return 解析后的数据列表 */ public static List<Map<String, String>> readExcelToObj(MultipartFile file) { List<Map<String, String>> result = new ArrayList<>(); try (InputStream inputStream = file.getInputStream()) { Workbook workbook = XSSFWorkbookFactory.create(inputStream); result = readExcel(workbook, 0, 0, 0); } catch (IOException e) { e.printStackTrace(); } return result; } /** * 读取Excel文件 * * @param workbook 工作簿 * @param sheetIndex sheet页下标:从0开始 * @param startReadLine 开始读取的行:从0开始 * @param tailLine 去除最后读取的行 * @return 解析后的数据列表 */ private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) { Sheet sheet = workbook.getSheetAt(sheetIndex); FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator(); List<Map<String, String>> result = new ArrayList<>(); for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) { Row row = sheet.getRow(i); Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator); result.add(rowData); } return result; } /** * 解析一行数据 * * @param sheet 工作表 * @param row 行对象 * @param formulaEvaluator 公式评估器 * @return 解析后的行数据 */ private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) { Map<String, String> rowData = new HashMap<>(); if (row != null) { int cellIndex = 0; for (Cell cell : row) { String cellValue = getCellValue(sheet, cell, formulaEvaluator); rowData.put("field" + cellIndex, cellValue); cellIndex++; } } return rowData; } /** * 获取单元格的值 * * @param sheet 工作表 * @param cell 单元格 * @param formulaEvaluator 公式评估器 * @return 单元格值 */ private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) { if (cell == null) return ""; return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex()) ? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator) : getCellStringValue(cell, formulaEvaluator); } /** * 获取合并单元格的值 * * @param sheet 工作表 * @param row 行号 * @param column 列号 * @param formulaEvaluator 公式评估器 * @return 合并单元格值 */ private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) { for (CellRangeAddress range : sheet.getMergedRegions()) { if (range.isInRange(row, column)) { Row firstRow = sheet.getRow(range.getFirstRow()); Cell firstCell = firstRow.getCell(range.getFirstColumn()); return getCellStringValue(firstCell, formulaEvaluator); } } return ""; } /** * 判断单元格是否是合并单元格 * * @param sheet 工作表 * @param row 行下标 * @param column 列下标 * @return 是否是合并单元格 */ private static boolean isMergedRegion(Sheet sheet, int row, int column) { for (CellRangeAddress range : sheet.getMergedRegions()) { if (range.isInRange(row, column)) { return true; } } return false; } /** * 获取单元格的字符串值 * * @param cell 单元格 * @param formulaEvaluator 公式评估器 * @return 单元格字符串值 */ private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) { switch (cell.getCellType()) { case STRING: return cell.getStringCellValue(); case BOOLEAN: return String.valueOf(cell.getBooleanCellValue()); case FORMULA: return formulaEvaluator.evaluate(cell).formatAsString(); case NUMERIC: return String.valueOf(cell.getNumericCellValue()); default: return ""; } } }
三、解析结果
以下内容基本为废话,大可直接忽略!
四、工具类详解及使用方法
在日常牛马中,处理Excel文件是一项常见且重要的任务。Excel文件通常包含丰富的结构化数据,其中合并单元格的处理尤为复杂。本文将介绍一个名为ReadMergeCellExcelUtil
的Java工具,帮助您轻松读取并解析Excel文件,处理合并单元格,并将结果转化为易于操作的Map集合。通过本文,您将学会如何使用该工具,以及理解其背后的实现原理。
准备工作
在开始之前,我们需要确保项目中添加了必要的依赖。这里我们主要使用Apache POI库来处理Excel文件。
Maven依赖:
<dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>5.0.0</version> </dependency>
工具功能概述
ReadMergeCellExcelUtil
工具的核心功能是解析Excel文件并处理合并单元格。它可以读取Excel文件,将每个单元格的内容存储到Map集合中,并正确处理合并单元格的值。典型的应用场景包括从Excel中读取配置数据、解析报表数据等。
代码详细解读
1. 读取Excel数据
方法:readExcelToObj
该方法用于读取上传的Excel文件,并将其内容解析为一个包含多个Map的列表。每个Map表示Excel文件中的一行数据。
public static List<Map<String, String>> readExcelToObj(MultipartFile file) { List<Map<String, String>> result = new ArrayList<>(); try (InputStream inputStream = file.getInputStream()) { Workbook workbook = XSSFWorkbookFactory.create(inputStream); result = readExcel(workbook, 0, 0, 0); } catch (IOException e) { e.printStackTrace(); } return result; }
使用try-with-resources
确保输入流在使用后正确关闭。
2. 解析Excel文件
方法:readExcel
该方法从工作簿中获取特定工作表,初始化公式评估器,并循环遍历行以解析每一行的数据。
private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) { Sheet sheet = workbook.getSheetAt(sheetIndex); FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator(); List<Map<String, String>> result = new ArrayList<>(); for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) { Row row = sheet.getRow(i); Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator); result.add(rowData); } return result; }
3. 解析一行数据
方法:parseRow
该方法遍历行中的单元格,并将其值存储到Map中。
private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) { Map<String, String> rowData = new HashMap<>(); if (row != null) { int cellIndex = 0; for (Cell cell : row) { String cellValue = getCellValue(sheet, cell, formulaEvaluator); rowData.put("field" + cellIndex, cellValue); cellIndex++; } } return rowData; }
4. 获取单元格值
方法:getCellValue
该方法根据单元格类型获取其值,并处理合并单元格。
private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) { if (cell == null) return ""; return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex()) ? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator) : getCellStringValue(cell, formulaEvaluator); }
5. 获取合并单元格值
方法:getMergedRegionValue
该方法查找并获取合并单元格的值。
private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) { for (CellRangeAddress range : sheet.getMergedRegions()) { if (range.isInRange(row, column)) { Row firstRow = sheet.getRow(range.getFirstRow()); Cell firstCell = firstRow.getCell(range.getFirstColumn()); return getCellStringValue(firstCell, formulaEvaluator); } } return ""; }
6. 判断单元格是否是合并单元格
方法:isMergedRegion
该方法检查指定单元格是否属于合并区域。
private static boolean isMergedRegion(Sheet sheet, int row, int column) { for (CellRangeAddress range : sheet.getMergedRegions()) { if (range.isInRange(row, column)) { return true; } } return false; }
7. 获取单元格的字符串值
方法:getCellStringValue
该方法根据单元格类型获取字符串值,并评估公式单元格。
private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) { switch (cell.getCellType()) { case STRING: return cell.getStringCellValue(); case BOOLEAN: return String.valueOf(cell.getBooleanCellValue()); case FORMULA: return formulaEvaluator.evaluate(cell).formatAsString(); case NUMERIC: return String.valueOf(cell.getNumericCellValue()); default: return ""; } }
示例代码
以下是一个完整的示例,展示如何使用ReadMergeCellExcelUtil
工具读取并解析Excel文件:
import org.springframework.web.multipart.MultipartFile; import java.util.List; import java.util.Map; public class ExcelParserExample { public static void main(String[] args) { // 假设有一个MultipartFile类型的Excel文件对象file MultipartFile file = ...; // 使用工具类解析Excel文件 List<Map<String, String>> parsedData = ReadMergeCellExcelUtil.readExcelToObj(file); // 打印解析结果 for (Map<String, String> rowData : parsedData) { System.out.println(rowData); } } }
运行结果将是Excel文件的解析数据,每一行数据以Map的形式存储。
常见问题与解决方案
- 空单元格处理:确保在解析单元格时处理空单元格,避免空指针异常。
- 大型Excel文件处理:对于大型Excel文件,可以考虑使用流式读取方法,以减少内存消耗。
结论
ReadMergeCellExcelUtil
工具提供了一种简单而有效的方式来解析Excel文件并处理合并单元格。通过使用Apache POI库,我们可以轻松处理各种复杂的Excel文件格式。未来,可以考虑进一步优化性能,并添加更多功能,如支持多种文件格式和自定义数据解析规则。