当前位置：首页 > news >正文

用 Python 和 Tesseract OCR 识别复杂验证码

news 2026/5/31 21:22:32

安装依赖

首先，确保已安装所需的工具和库。

安装 Tesseract

在 Windows 上，下载安装包并进行安装：Tesseract GitHub。

在 Linux 上，你可以通过以下命令安装：

sudo apt-get install tesseract-ocr

安装 Python 库

使用 pip 安装 Python 库：

pip install pytesseract Pillow opencv-python numpy

编写 Python 代码

import pytesseract
from PIL import Image
import cv2
import numpy as np

设置 Tesseract 路径（如果在 Windows 上安装）

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

def preprocess_image(image_path):
# 读取图像
img = cv2.imread(image_path)

# 转换为灰度图像
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 高斯模糊去噪
blurred = cv2.GaussianBlur(gray, (5, 5), 0)# 自适应阈值处理：把图像转换成黑白
binary_image = cv2.adaptiveThreshold(blurred, 255, cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY, 11, 2)# 使用形态学操作去除噪点：膨胀和腐蚀
kernel = np.ones((3, 3), np.uint8)
dilated_image = cv2.dilate(binary_image, kernel, iterations=1)# 对图像进行轮廓检测，去除背景噪声
contours, _ = cv2.findContours(dilated_image, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)# 在图像上绘制轮廓，去除可能的干扰
clean_image = np.zeros_like(gray)
for contour in contours:if cv2.contourArea(contour) > 500:  # 过滤掉小面积的轮廓cv2.drawContours(clean_image, [contour], -1, (255, 255, 255), -1)return clean_image

def recognize_captcha(image_path):
# 预处理图像
processed_image = preprocess_image(image_path)

# 将处理后的图像保存为临时文件
temp_image_path = "processed_captcha.png"
cv2.imwrite(temp_image_path, processed_image)# 使用 Tesseract 进行 OCR 识别
text = pytesseract.image_to_string(Image.open(temp_image_path))return text.strip()

if name == 'main':
# 输入验证码图像路径
captcha_image_path = 'captcha_image.png'

# 识别验证码
captcha_text = recognize_captcha(captcha_image_path)print("识别的验证码是:", captcha_text)

代码解释
Tesseract 设置

如果你没有将 Tesseract 路径添加到环境变量中，可以通过以下方式设置其路径：

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

图像预处理步骤

灰度化：首先将图像转为灰度图，减少颜色信息，专注于字符形状。

高斯模糊：使用高斯模糊平滑图像，去除一些细小的噪点。

自适应阈值：使用自适应阈值将图像转为黑白二值图，这有助于增强字符的对比度，去除背景干扰。

膨胀操作：通过膨胀操作增强字符的轮廓，使其更加清晰。

轮廓检测：通过轮廓检测来排除一些干扰元素，仅保留字符区域。通过过滤小面积的轮廓，去除不必要的干扰。

OCR 识别

图像处理后，我们将图像传给 Tesseract OCR 进行文字识别。pytesseract.image_to_string() 会返回识别的文本内容。

运行程序

准备好验证码图像（例如 captcha_image.png），然后运行代码。输出将显示识别出的验证码文本：

识别的验证码是: ab2c1

优化与改进

进一步去噪：如果验证码图像仍然存在噪点，可以尝试使用中值滤波（cv2.medianBlur()）或者更复杂的噪声去除方法。

字符分割：对于一些字符重叠或复杂的验证码，可以尝试更复杂的字符分割技术。可以使用轮廓检测或切割算法将每个字符分开，再逐个识别。

字形训练：如果验证码使用了非常规字体或干扰背景，考虑使用机器学习技术训练 Tesseract 或者结合深度学习模型来识别。

图像增强：尝试增强对比度或使用其他图像增强技术，以帮助 Tesseract 更好地识别验证码。

查看全文

http://www.rkmt.cn/news/52532.html

用 Go 进行验证码识别

Spring AI Alibaba 项目源码学习（十）-Interceptor

今日复盘

13 个 pytest 宝藏插件推荐！（存存存）

java 1.8 linux

事件循环其实很简单！

Upgrade Your Key Programming: New Style CG A22-3+1 Flip-4BTN Wire Remote for CGDI K2 (5pcs/lot)

深入解析：使用 Triton 实现 Flash Attention2 - 让大模型训练飞起来

题解：P8819 [CSP-S 2022] 星战

Java集合之【CopyOnWrite和Collections.synchronizedList()的区别】

20232324 2024-2025-1 《网络与系统攻防技术》实验六实验报告

复杂状态与数据流管理：分布式定时任务系统的设计

【第6章字符串】Python 字符串常用操作完全教程（含代码演示）

Sora 2 Cameo多角色上传+Remix二创功能API接入教程，史低0.08/条

第28天(简单题中等题二分查找)

一次尝试，3个小时90元的主机游玩和F1电影

静态路由的配置

一段话 UOJ

CF1375G Tree Modification 题解

《算　设》学

[GESP202506 二级] 幂和数

*题解：P3586 [POI 2015 R2] 物流 Logistics

一类将度数变为 1/2 的优化建图笔记

2025 年锚具厂家 TOP 企业品牌推荐排行榜，橡胶支座 / 桥梁支座 / 国标支座 / 滑板支座 / 固定支座 / 弹性支座 / 活动铰支座 / 盆式支座 / 减震支座 / 缓冲支座公司推荐！

软件工程学习日志2025.11.17

CSP2025 游记 + whk 期中

Flask+Celery+Blueprint

2025年11月学习机榜单：打破智商税偏见，十大提分机型实证推荐

UV python管理工具 mac电脑

设置 Tesseract 路径（如果在 Windows 上安装）

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

相关文章：