当前位置:主页 > 软件编程 > Python代码 >

python pytesseract库的实例用法

时间:2022-11-27 10:22:58 | 栏目:Python代码 | 点击:

说明

1、pytesseract需要与安装在本地的tesseract-ocr.exe文件一起使用。

2、需要注意的是,安装时必须选择中文包,默认只支持英文识别。

安装命令

pip install pytesseract

实例

import pytesseract
from PIL import Image
text = pytesseract.image_to_string(Image.open(r"d:\Desktop\39DEE621-40EA-4ad1-90CC-79EB51D39347.png"))
print(text)

识别结果输出

Using Tesseract OCR with Python
# import the necessary packages
from PIL import Image
import pytesseract
import ergperse
import cv2
import os
 
# construct the argument parse and parse the arguments
ap = argparse.ArgunentParser()
ap.add_argument("-i", "--image", required-True,
help="path to input image to be OCR'd")
ap.add_argument("-p", "--preprocess", typesstr, default="thresh",
helpe"type of preprocessing to be done")
args = vars (ap.parse_args())

实例扩展:

Python使用pytesseract库识别图片文字

准备

首先需在本机安装Tesseract客户端,然后安装pytesseract库:

pip install pytesseract

没安装过PIL的也要安装一下,因为所调用的第一个参数是由Image类返回:

pip install PILLOW

实例

import pytesseract
from PIL import Image

img = Image.open("D://aa.jpg")
text = pytesseract.image_to_string(img, lang="chi_sim")
print(text)

您可能感兴趣的文章:

相关文章