php编程实现获取excel文档内容的代码实例，php如何读取excel数据

2026年3月21日 07:28 • 云服务器 • 阅读 67

在PHP项目开发中，高效、精准地读取Excel文档内容，核心方案在于选用成熟的第三方库（如PhpSpreadsheet）并结合服务器环境优化，而非尝试原生解析。直接使用原生PHP脚本解析Excel的二进制结构极其复杂且易出错，利用PhpSpreadsheet库是目前PHP生态中最稳定、功能最全的行业标准解决方案，能够完美兼容xlsx、xls等多种格式，并提供流畅的内存管理与数据读取体验。

核心实现方案：PhpSpreadsheet库的应用

PHP原生函数（如fgetcsv）仅能处理简单的CSV文本，面对复杂的Excel文件（.xlsx或.xls）时，由于文件格式涉及复杂的XML打包与二进制编码，原生方案几乎不可行。PhpSpreadsheet作为PHPExcel的继承者，不仅修复了大量历史遗留问题，还提供了现代化的命名空间支持和强大的内存优化机制。 它是当前实现Excel读取的首选组件。

在编码前，需通过Composer安装依赖，这是现代PHP开发的标准流程，确保了版本管理的稳定性,执行命令如下：

composer require phpoffice/phpspreadsheet

安装完成后，即可编写核心读取逻辑。为了保证代码的健壮性，必须引入异常处理机制，防止因文件损坏或格式不符导致的脚本中断。 以下是一个基础且严谨的读取示例代码：

require 'vendor/autoload.php';
use PhpOfficePhpSpreadsheetIOFactory;
use PhpOfficePhpSpreadsheetSharedDate;
function readExcelContent($filePath) {
    try {
        // 检测文件是否真实存在
        if (!file_exists($filePath)) {
            throw new Exception("文件不存在: " . $filePath);
        }
        // 使用IOFactory自动识别文件格式（xlsx, xls, csv等）
        $spreadsheet = IOFactory::load($filePath);
        // 获取活动工作表
        $sheet = $spreadsheet->getActiveSheet();
        // 转换为数组形式，这是最高效的读取方式
        $data = $sheet->toArray(null, true, true, true);
        return $data;
    } catch (Exception $e) {
        // 生产环境中应记录日志而非直接打印
        error_log('Excel读取错误: ' . $e->getMessage());
        return false;
    }
}
// 调用示例
$result = readExcelContent('./data.xlsx');
if ($result) {
    foreach ($result as $row) {
        // 处理每一行数据
        print_r($row);
    }
}

上述代码中，IOFactory::load()方法是核心，它能智能识别文件后缀并调用相应的解析引擎，极大降低了开发者的心智负担。toArray()方法则将复杂的单元格对象直接转换为PHP数组,实现了业务逻辑与解析逻辑的解耦。

进阶优化：大文件读取与内存管理

在处理小型Excel文件时，上述代码游刃有余，但在企业级应用中，经常面临数万行甚至数十万行数据的大文件。默认情况下，PhpSpreadsheet会将整个Excel文件加载到内存中，这对于大文件来说是灾难性的，极易导致PHP内存溢出。

针对此痛点，必须采用“分块读取”或“缓存优化”策略。使用ChunkFilter过滤器是实现大文件流式读取的关键技术手段。 它允许开发者定义一个读取过滤器，只加载指定行数的数据到内存中，处理完毕后清除,再加载下一块。

以下是结合分块过滤器的优化方案：

use PhpOfficePhpSpreadsheetReaderIReadFilter;
// 定义自定义过滤器类
class ChunkReadFilter implements IReadFilter {
    private $startRow;
    private $endRow;
    public function __construct($startRow, $chunkSize) {
        $this->startRow = $startRow;
        $this->endRow   = $startRow + $chunkSize;
    }
    public function readCell($column, $row, $worksheetName = '') {
        // 只读取指定范围内的行
        return ($row >= $this->startRow && $row < $this->endRow);
    }
}
function readLargeExcel($filePath, $chunkSize = 1000) {
    $reader = IOFactory::createReaderForFile($filePath);
    $reader->setReadDataOnly(true); // 只读取数据，忽略格式，节省内存
    $totalRows = $reader->listWorksheetInfo($filePath)[0]['totalRows'];
    for ($startRow = 1; $startRow <= $totalRows; $startRow += $chunkSize) {
        $chunkFilter = new ChunkReadFilter($startRow, $chunkSize);
        $reader->setReadFilter($chunkFilter);
        $spreadsheet = $reader->load($filePath);
        $sheet = $spreadsheet->getActiveSheet();
        // 处理当前分块的数据
        $rows = $sheet->toArray();
        foreach ($rows as $row) {
            // 业务逻辑处理，如入库或计算
        }
        // 手动清理内存
        $spreadsheet->disconnectWorksheets();
        unset($spreadsheet);
    }
}

设置setReadDataOnly(true)也是一项关键优化，它告诉解析器忽略字体、颜色、边框等样式信息，仅提取单元格数值，能显著降低内存占用。

实战案例：酷番云环境下的数据处理优化

在实际的云端部署中，代码逻辑仅仅是成功的一半，服务器环境的配置同样至关重要。我们在酷番云的云服务器产品线上，曾协助一家电商客户处理每日定时生成的海量订单Excel报表。

该客户最初使用常规的load()方法读取超过50MB的Excel文件，导致PHP脚本频繁报出“Allowed memory size exhausted”错误，甚至触发了酷番云服务器监控的内存阈值告警。通过深入分析，我们发现问题的根源不仅在于代码，还在于PHP配置文件中memory_limit的设置过于僵化。

我们为客户提供了双重解决方案：

代码层面：引入上述的ChunkReadFilter分块读取机制，并配合setReadDataOnly(true)剥离无用样式。
环境层面：利用酷番云控制面板的灵活性，动态调整了PHP运行环境的memory_limit,并开启了OPCache加速。

经过优化，脚本内存占用从峰值512MB降低至稳定的32MB以内，处理速度提升了300%。这一案例充分证明，优秀的Excel解析方案必须是“代码逻辑”与“云基础设施”的深度结合。 酷番云服务器的高性能I/O特性，确保了在磁盘频繁读取分块数据时，不会成为性能瓶颈,从而实现了数据处理的极致效率。

数据清洗与类型转换的专业建议

读取Excel内容只是第一步，真实业务数据往往充满了“脏数据”。Excel单元格中的日期格式在PHP读取时经常会被误读为数字（Excel内部使用浮点数存储日期），这是开发中最常见的陷阱。

专业的处理方式是在读取后立即进行类型判断与转换，PhpSpreadsheet提供了Date::excelToDateTimeObject方法来处理此类问题。

foreach ($sheet->getRowIterator() as $row) {
    $cellIterator = $row->getCellIterator();
    foreach ($cellIterator as $cell) {
        $value = $cell->getValue();
        // 判断是否为日期类型
        if (PhpOfficePhpSpreadsheetSharedDate::isDateTime($cell)) {
            $value = Date::excelToDateTimeObject($value)->format('Y-m-d H:i:s');
        }
        // 存入清洗后的数据数组
        $cleanData[] = $value;
    }
}

务必不要相信用户上传的Excel数据格式是完全规范的，对空值、特殊字符、日期格式的校验是保证系统数据完整性的最后一道防线。