如何用Python提取图片文字 | PIL识别图片文字教程

要使用 Python 识别图片中的文字,推荐使用 Pillow (PIL) 配合 Tesseract OCR 引擎(通过 pytesseract 库),以下是详细步骤:

pil识别图片文字


步骤 1:安装依赖

  1. 安装 Tesseract OCR(核心引擎):

    • Windows:下载安装包 UB-Mannheim/tesseract
    • MacOSbrew install tesseract
    • Linux (Debian/Ubuntu)sudo apt install tesseract-ocr
    • 语言包(如需要中文):
      sudo apt install tesseract-ocr-chi-sim(简体中文)
      sudo apt install tesseract-ocr-chi-tra(繁体中文)
  2. 安装 Python 库

    pip install pillow pytesseract

步骤 2:Python 示例代码

from PIL import Image
import pytesseract
# 设置 Tesseract 路径(Windows 需要指定安装路径)
# pytesseract.pytesseract.tesseract_cmd = r'C:Program FilesTesseract-OCRtesseract.exe'
# 打开图片
image = Image.open('your_image.jpg')  # 替换为你的图片路径
# 识别文字(默认英文)
text = pytesseract.image_to_string(image)
# 识别中文(简体)
# text = pytesseract.image_to_string(image, lang='chi_sim')
print("识别结果:")
print(text)

常见问题解决

  1. 中文识别不准确

    pil识别图片文字

    • 确保安装了中文语言包(如 tesseract-ocr-chi-sim)。
    • 使用 lang='chi_sim' 参数。
    • 优化图片质量(清晰、无反光、正对拍摄)。
  2. 报错 tesseract is not installed

    • 检查 tesseract 是否在系统路径中。
    • Windows 需手动设置路径(取消注释代码中的 tesseract_cmd)。
  3. 提高识别精度

    • 预处理图片:转为灰度、二值化、降噪。
    • 调整图片:使用图像处理库(如 OpenCV)增强对比度。
    • 指定区域识别:通过 image.crop((x, y, width, height)) 裁剪局部区域。

预处理增强示例

from PIL import Image, ImageFilter
# 打开图片并预处理
image = Image.open('your_image.jpg')
image = image.convert('L')  # 转为灰度
image = image.filter(ImageFilter.SHARPEN)  # 锐化
image = image.point(lambda x: 0 if x < 140 else 255)  # 二值化
# 识别文字
text = pytesseract.image_to_string(image, lang='chi_sim')
print(text)

替代方案:第三方 API

如果本地识别效果不佳,可使用在线 OCR API:

pil识别图片文字

  1. 百度 OCR:高精度中文识别(有免费额度)
  2. Google Vision:英文识别效果好
  3. 腾讯 OCR:支持多语言

提示:在线 API 需处理网络请求和隐私问题。

图片来源于AI模型,如侵权请联系管理员。作者:酷小编,如若转载,请注明出处:https://www.kufanyun.com/ask/294241.html

(0)
上一篇 2026年2月12日 15:20
下一篇 2026年2月12日 15:26

相关推荐

  • plex云服务器如何选择?新手配置指南与推荐方案全解析?

    Plex作为一款功能强大的家庭媒体中心解决方案,通过云服务器实现跨设备媒体管理,已成为现代家庭娱乐的核心工具,随着云技术的普及,选择合适的Plex云服务器成为用户提升体验的关键,本文将从Plex云服务器的定义、选择标准、配置流程、实际案例及优化维护等方面进行详细阐述,结合酷番云云产品经验,为用户提供专业参考,什……

    2026年1月21日
    01740
  • 如何优化protobuf在网络通信中的性能与数据传输效率?

    Protobuf网络交互详解在分布式系统、微服务架构等现代软件设计中,服务间的网络交互是核心环节,高效的通信协议与数据序列化技术直接影响系统的性能、可扩展性与稳定性,Protobuf(Protocol Buffers)作为Google开发的跨语言数据序列化方案,凭借其高效的性能、轻量级体积及强大的跨语言支持,成……

    2026年1月7日
    02330
    • 服务器间歇性无响应是什么原因?如何排查解决?

      根源分析、排查逻辑与解决方案服务器间歇性无响应是IT运维中常见的复杂问题,指服务器在特定场景下(如高并发时段、特定操作触发时)出现短暂无响应、延迟或服务中断,而非持续性的宕机,这类问题对业务连续性、用户体验和系统稳定性构成直接威胁,需结合多维度因素深入排查与解决,常见原因分析:从硬件到软件的多维溯源服务器间歇性……

      2026年1月10日
      020
  • 2017 青岛宽带怎么办理?2017 青岛宽带价格是多少

    2026 年青岛宽带市场已全面进入千兆光纤普及与融合套餐主导期,首选青岛移动或青岛电信的“千兆宽带 + 5G 手机卡 + 智能组网”融合方案,是兼顾性价比与稳定性的最优解,随着 2026 年“双千兆”城市建设的深化,青岛宽带服务已从单纯的速度竞争转向“网络质量 + 应用生态 + 服务响应”的综合体验竞争,对于普……

    2026年5月12日
    01015
  • 移动宽带要求是什么?移动宽带办理条件有哪些

    2026 年移动宽带办理核心门槛已明确:需本人持二代身份证实名登记,且安装地址必须覆盖中国移动 5G/10G PON 网络覆盖区,无合约限制,价格区间通常在 129 元至 199 元/月(含千兆融合套餐),随着 2026 年“双千兆”网络建设的全面深化,移动宽带的接入标准已从单纯的“信号覆盖”转向“质量分级”与……

    2026年5月12日
    05313

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

评论列表(5条)

  • smart220的头像
    smart220 2026年2月14日 21:46

    这篇教程太及时了!跟着步骤试了下用Pillow+Tesseract识别发票文字,省去了手动输入的麻烦。不过中文识别偶尔会串行,感觉加个图像预处理会更准,期待作者后续优化技巧~

    • kind199fan的头像
      kind199fan 2026年2月14日 21:59

      @smart220对啊,跟着教程试了确实省时!中文识别串行我也遇到过,感觉加个图像预处理像去噪或调亮度会好很多,我自己试过裁剪多余部分也有帮助。期待作者的新技巧~

  • 茶bot920的头像
    茶bot920 2026年2月14日 22:13

    这篇教程太实用了!我之前一直手动敲图片里的文字,效率低还容易出错。原来用Python+OCR这么简单就能搞定,步骤讲得也清晰,Pillow和Tesseract的组合确实方便。这下处理扫描文档或者截图里的文字就省心多了,收藏起来下次直接抄作业!

  • 山山8246的头像
    山山8246 2026年2月14日 22:26

    这个教程真实用!我之前也用PIL和Tesseract提取过图片文字,组合起来识别效果挺准的,特别适合处理文档扫描。步骤写得简单清晰,新手照着做肯定能上手,不过复杂图片有时需要多调整参数。

  • 树鹰9519的头像
    树鹰9519 2026年2月14日 22:48

    这篇文章太实用了!我刚用PIL和pytesseract试了下,提取图片文字又快又准,以前手动打字累死人,现在省了好多时间。教程步骤很清楚,新手也能轻松上手,真心感谢分享!