如何用Python提取图片文字 | PIL识别图片文字教程

要使用 Python 识别图片中的文字,推荐使用 Pillow (PIL) 配合 Tesseract OCR 引擎(通过 pytesseract 库),以下是详细步骤:

pil识别图片文字


步骤 1:安装依赖

  1. 安装 Tesseract OCR(核心引擎):

    • Windows:下载安装包 UB-Mannheim/tesseract
    • MacOSbrew install tesseract
    • Linux (Debian/Ubuntu)sudo apt install tesseract-ocr
    • 语言包(如需要中文):
      sudo apt install tesseract-ocr-chi-sim(简体中文)
      sudo apt install tesseract-ocr-chi-tra(繁体中文)
  2. 安装 Python 库

    pip install pillow pytesseract

步骤 2:Python 示例代码

from PIL import Image
import pytesseract
# 设置 Tesseract 路径(Windows 需要指定安装路径)
# pytesseract.pytesseract.tesseract_cmd = r'C:Program FilesTesseract-OCRtesseract.exe'
# 打开图片
image = Image.open('your_image.jpg')  # 替换为你的图片路径
# 识别文字(默认英文)
text = pytesseract.image_to_string(image)
# 识别中文(简体)
# text = pytesseract.image_to_string(image, lang='chi_sim')
print("识别结果:")
print(text)

常见问题解决

  1. 中文识别不准确

    pil识别图片文字

    • 确保安装了中文语言包(如 tesseract-ocr-chi-sim)。
    • 使用 lang='chi_sim' 参数。
    • 优化图片质量(清晰、无反光、正对拍摄)。
  2. 报错 tesseract is not installed

    • 检查 tesseract 是否在系统路径中。
    • Windows 需手动设置路径(取消注释代码中的 tesseract_cmd)。
  3. 提高识别精度

    • 预处理图片:转为灰度、二值化、降噪。
    • 调整图片:使用图像处理库(如 OpenCV)增强对比度。
    • 指定区域识别:通过 image.crop((x, y, width, height)) 裁剪局部区域。

预处理增强示例

from PIL import Image, ImageFilter
# 打开图片并预处理
image = Image.open('your_image.jpg')
image = image.convert('L')  # 转为灰度
image = image.filter(ImageFilter.SHARPEN)  # 锐化
image = image.point(lambda x: 0 if x < 140 else 255)  # 二值化
# 识别文字
text = pytesseract.image_to_string(image, lang='chi_sim')
print(text)

替代方案:第三方 API

如果本地识别效果不佳,可使用在线 OCR API:

pil识别图片文字

  1. 百度 OCR:高精度中文识别(有免费额度)
  2. Google Vision:英文识别效果好
  3. 腾讯 OCR:支持多语言

提示:在线 API 需处理网络请求和隐私问题。

图片来源于AI模型,如侵权请联系管理员。作者:酷小编,如若转载,请注明出处:https://www.kufanyun.com/ask/294241.html

(0)
上一篇 2026年2月12日 15:20
下一篇 2026年2月12日 15:26

相关推荐

  • 如何确保云服务器的安全性?

    云服务器的灵活性、可靠性和可扩展性使其成为远程工作和数据存储的不可或缺的工具。然而,随之而来的是对云服务器安全性的担忧。 1、选择可靠服务商 要确保云服务器的安全性,首先需要选择可…

    2024年1月4日
    04340
  • 如何通过隐私检测精准识别并规避用户数据中的潜在隐私风险?

    定义、方法与应用实践隐私检测的定义与意义隐私检测是指通过技术手段识别、评估和管理数据中敏感个人信息(如姓名、身份证号、生物特征、地理位置等)的过程,是数据合规、用户信任与数据安全的核心环节,随着《通用数据保护条例》(GDPR)、《加州消费者隐私法案》(CCPA)等全球性法规的普及,隐私检测从传统数据脱敏扩展为贯……

    2026年1月6日
    01940
    • 服务器间歇性无响应是什么原因?如何排查解决?

      根源分析、排查逻辑与解决方案服务器间歇性无响应是IT运维中常见的复杂问题,指服务器在特定场景下(如高并发时段、特定操作触发时)出现短暂无响应、延迟或服务中断,而非持续性的宕机,这类问题对业务连续性、用户体验和系统稳定性构成直接威胁,需结合多维度因素深入排查与解决,常见原因分析:从硬件到软件的多维溯源服务器间歇性……

      2026年1月10日
      020
  • 我的景安虚拟主机后台登录入口具体网址是什么啊,在哪里找?

    对于许多初次接触网站建设的管理者来说,成功购买虚拟主机仅仅是第一步,如何顺利登录并进入管理后台,才是后续所有工作的核心,景安网络作为国内知名的 IDC 服务商,其虚拟主机产品因其稳定性和性价比而备受青睐,不少新用户在面对“景安虚拟主机在哪里登录”这一问题时,仍会感到些许困惑,本文将为您提供一份详尽、清晰的操作指……

    2025年10月18日
    02270
  • ping远程ip的8080端口

    在网络运维与服务器管理过程中,检测特定端口的连通性是排查服务故障的核心环节,许多用户习惯性地提出“ping远程ip的8080端口”这一需求,但从网络协议的严格定义来看,标准的Ping命令使用的是ICMP(Internet Control Message Protocol)协议,它工作在网络层(第3层),仅能验证……

    2026年2月4日
    01810

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

评论列表(5条)

  • smart220的头像
    smart220 2026年2月14日 21:46

    这篇教程太及时了!跟着步骤试了下用Pillow+Tesseract识别发票文字,省去了手动输入的麻烦。不过中文识别偶尔会串行,感觉加个图像预处理会更准,期待作者后续优化技巧~

    • kind199fan的头像
      kind199fan 2026年2月14日 21:59

      @smart220对啊,跟着教程试了确实省时!中文识别串行我也遇到过,感觉加个图像预处理像去噪或调亮度会好很多,我自己试过裁剪多余部分也有帮助。期待作者的新技巧~

  • 茶bot920的头像
    茶bot920 2026年2月14日 22:13

    这篇教程太实用了!我之前一直手动敲图片里的文字,效率低还容易出错。原来用Python+OCR这么简单就能搞定,步骤讲得也清晰,Pillow和Tesseract的组合确实方便。这下处理扫描文档或者截图里的文字就省心多了,收藏起来下次直接抄作业!

  • 山山8246的头像
    山山8246 2026年2月14日 22:26

    这个教程真实用!我之前也用PIL和Tesseract提取过图片文字,组合起来识别效果挺准的,特别适合处理文档扫描。步骤写得简单清晰,新手照着做肯定能上手,不过复杂图片有时需要多调整参数。

  • 树鹰9519的头像
    树鹰9519 2026年2月14日 22:48

    这篇文章太实用了!我刚用PIL和pytesseract试了下,提取图片文字又快又准,以前手动打字累死人,现在省了好多时间。教程步骤很清楚,新手也能轻松上手,真心感谢分享!