利用Python实现简单的验证码处理

来源：jb51　　时间：2022/6/27 16:57:54　　对本文有异议

序言

我们在做采集数据的时候，过快或者访问频繁，或者一访问就给弹出验证码，然后就蚌珠了~

今天就给大家来一个简单处理验证码的方法

环境模块

这里需要用到一个 ddddocr 模块，这是别人开源写好的一个东西，简单又好用，但是精确度差一点点，但是还是非常好用的。

如果你追求精确度的话，可以调用别人写好的一些API 。

咱们直接 win+r 弹出搜索框后输入 cmd ，点击确定弹出命令提示符窗口，输入pip install ddddocr 即可安装。

不会的话详细参考我置顶文章有详细讲解。

代码展示

代码不多，非常简单。

模块安装好之后咱们先导入一下：

import ddddocr

然后实例化一下，用一个 cor 接收一下这个数据。

ocr = ddddocr.DdddOcr()

我这里准备了四个验证码：

首先我们用 with open 来读取一下这文件，读取方式使用 rb ，因为是图片的话就读取它的二进制数据

with open('img_3.png', 'rb') as f:

使用 f.read() 将数据读取出来，再自定义一个变量接收一下。

img_bytes = f.read()

然后我们通过 classification 将它传进去，把结果打印出来就可以了。

result = ocr.classification(img_bytes)
print(result)

实现效果：

纯数字的

字母+数字的

可以看到都完整的识别出来了，即使上面有一些花里胡哨的横线啥的。

完整代码

import ddddocr
ocr = ddddocr.DdddOcr()
with open('img_3.png', 'rb') as f:
    img_bytes = f.read()
result = ocr.classification(img_bytes)
print(result)

大家可以自己去试试，也可以直接应用在采集数据实践当中~

到此这篇关于利用Python实现简单的验证码处理的文章就介绍到这了,更多相关 Python验证码处理内容请搜索w3xue以前的文章或继续浏览下面的相关文章希望大家以后多多支持w3xue！

友情链接：直通硅谷　点职佳　北美留学生论坛

Python热门文章

Python | 新冠肺炎疫情数据的爬取与可视化分析

Python爬小草1024图片，盖达尔的诱惑（urllib.request）

pytorch如何获得模型的计算量和参数量

Python爬虫基础讲解（二十）：多进程——multiprocessing模块的使用

python?OpenCV计算图片相似度的5种算法

matplotlib 设置图形大小时 figsize 与 dpi 的关系

[python] 启发式算法库scikit-opt使用指北

界面自动化测试录制工具，让python selenium自动化测试脚本开发更加方便

音频文件降噪及python示例

全网最适合入门的面向对象编程教程：20 类和对象的 Python 实现-组合关系的实现与 CSV 文件保存

张高兴的 MicroPython 入门指南：（一）环境配置、Blink、部署

Python——比 Seaborn 更好的相关性热力图：Biokit Corrplot

目录

序言

环境模块

代码展示

完整代码

Python热门文章

Python推荐文章