如何用Python提取图片文字 | PIL识别图片文字教程

要使用 Python 识别图片中的文字,推荐使用 Pillow (PIL) 配合 Tesseract OCR 引擎(通过 pytesseract 库),以下是详细步骤:

pil识别图片文字


步骤 1:安装依赖

  1. 安装 Tesseract OCR(核心引擎):

    • Windows:下载安装包 UB-Mannheim/tesseract
    • MacOSbrew install tesseract
    • Linux (Debian/Ubuntu)sudo apt install tesseract-ocr
    • 语言包(如需要中文):
      sudo apt install tesseract-ocr-chi-sim(简体中文)
      sudo apt install tesseract-ocr-chi-tra(繁体中文)
  2. 安装 Python 库

    pip install pillow pytesseract

步骤 2:Python 示例代码

from PIL import Image
import pytesseract
# 设置 Tesseract 路径(Windows 需要指定安装路径)
# pytesseract.pytesseract.tesseract_cmd = r'C:Program FilesTesseract-OCRtesseract.exe'
# 打开图片
image = Image.open('your_image.jpg')  # 替换为你的图片路径
# 识别文字(默认英文)
text = pytesseract.image_to_string(image)
# 识别中文(简体)
# text = pytesseract.image_to_string(image, lang='chi_sim')
print("识别结果:")
print(text)

常见问题解决

  1. 中文识别不准确

    pil识别图片文字

    • 确保安装了中文语言包(如 tesseract-ocr-chi-sim)。
    • 使用 lang='chi_sim' 参数。
    • 优化图片质量(清晰、无反光、正对拍摄)。
  2. 报错 tesseract is not installed

    • 检查 tesseract 是否在系统路径中。
    • Windows 需手动设置路径(取消注释代码中的 tesseract_cmd)。
  3. 提高识别精度

    • 预处理图片:转为灰度、二值化、降噪。
    • 调整图片:使用图像处理库(如 OpenCV)增强对比度。
    • 指定区域识别:通过 image.crop((x, y, width, height)) 裁剪局部区域。

预处理增强示例

from PIL import Image, ImageFilter
# 打开图片并预处理
image = Image.open('your_image.jpg')
image = image.convert('L')  # 转为灰度
image = image.filter(ImageFilter.SHARPEN)  # 锐化
image = image.point(lambda x: 0 if x < 140 else 255)  # 二值化
# 识别文字
text = pytesseract.image_to_string(image, lang='chi_sim')
print(text)

替代方案:第三方 API

如果本地识别效果不佳,可使用在线 OCR API:

pil识别图片文字

  1. 百度 OCR:高精度中文识别(有免费额度)
  2. Google Vision:英文识别效果好
  3. 腾讯 OCR:支持多语言

提示:在线 API 需处理网络请求和隐私问题。

图片来源于AI模型,如侵权请联系管理员。作者:酷小编,如若转载,请注明出处:https://www.kufanyun.com/ask/294241.html

(0)
上一篇 2026年2月12日 15:20
下一篇 2026年2月12日 15:26

相关推荐

  • 初次使用虚拟主机,主控面板密码应该在哪里设置?

    在数字化的浪潮中,虚拟主机已成为无数网站、博客和在线业务的基石,而管理这一切的核心工具,便是虚拟主机主控面板,无论是广为人知的cPanel、Plesk,还是各主机商自研的面板,它们都扮演着网站“指挥中心”的角色,要进入这个中心,唯一且最关键的钥匙,便是您的登录密码,理解并正确设置虚拟主机主控面板密码,不仅是基本……

    2025年10月17日
    01130
  • PostgreSQL主从复制配置与优化,如何解决同步延迟与数据不一致问题?

    PostgreSQL作为企业级关系型数据库,其主从复制(Master-Slave Replication)是其核心高可用与可扩展特性之一,通过主库处理写操作,从库同步数据以提供读扩展或故障切换,是构建高可用数据库系统的关键技术,本文将从主从复制的原理、配置、优化及故障处理等维度,结合实际案例,深入探讨Postg……

    2026年1月24日
    0350
    • 服务器间歇性无响应是什么原因?如何排查解决?

      根源分析、排查逻辑与解决方案服务器间歇性无响应是IT运维中常见的复杂问题,指服务器在特定场景下(如高并发时段、特定操作触发时)出现短暂无响应、延迟或服务中断,而非持续性的宕机,这类问题对业务连续性、用户体验和系统稳定性构成直接威胁,需结合多维度因素深入排查与解决,常见原因分析:从硬件到软件的多维溯源服务器间歇性……

      2026年1月10日
      020
  • 新手玩PS4时,网络设定常见问题及解决方法是什么?

    PS4网络设定指南:优化连接体验的关键步骤PS4作为一款主流游戏主机,其网络连接性能直接影响在线游戏体验、游戏更新下载速度及社交功能使用,合理的网络设定不仅能提升游戏流畅度,还能避免连接中断、延迟高等问题,本文将详细介绍PS4的网络连接类型、配置步骤、优化技巧及常见问题解决方案,帮助玩家轻松配置网络,享受稳定在……

    2026年1月7日
    0950
  • 如何通过post抓包获取短信校验码?流程、问题与解决全解析?

    什么是“抓包短信校验码”?网络抓包(Packet Sniffing)是指通过捕获网络数据包,分析通信过程的技术,在短信校验码场景中,“抓包”指攻击者利用网络嗅探工具(如Wireshark、Fiddler),截获发送至用户手机的短信验证码数据包,从而获取验证码内容,短信校验码的传输依赖短信网关(SMS Gatew……

    2026年1月14日
    0810

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注