python - Tesseract-OCR图片转文字使用流程

it2025-12-29  4

1 下载软件 tesseract-ocr-setup-4.00.00dev.exe


2 分别添加path环境变量  和 自定义环境变量

path中的路径

新建变量路径 TESSDATA_PREFIX


3 在cmd控制台尝试识别图片

#运行程序 参数1 图片路径 参数2 输出的txt文件名称 C:\Users\30818\Desktop> tesseract 88.png outputimg

4 在python 中进行使用

import re # 用于正则 from PIL import Image # 用于打开图片和对图片处理 import pytesseract # 用于图片转文字 from selenium import webdriver # 用于打开网站 import time # 代码运行停顿 import argparse #命令行参数解析包 #得到一张图片 img = Image.open("C:\\Users\\30818\\Desktop\\5.png"); #转灰度 img = img.convert('L'); #裁切图片 img = img.crop((12,11,87,40)); #显示一下我们的图片 img.show(); # 设置pyteseract路径 # C:\Program Files (x86)\Tesseract-OCR pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe" # 图片转文字 result = pytesseract.image_to_string(img); print(result);

若配置好环境变量后依然报错 尝试重启后是否解决问题

最新回复(0)