经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » Python » 查看文章
利用Python实现简单的验证码处理
来源:jb51  时间:2022/6/27 16:57:54  对本文有异议

序言

我们在做采集数据的时候,过快或者访问频繁,或者一访问就给弹出验证码,然后就蚌珠了~

今天就给大家来一个简单处理验证码的方法

环境模块

这里需要用到一个 ddddocr 模块 ,这是别人开源写好的一个东西,简单又好用,但是精确度差一点点,但是还是非常好用的。

如果你追求精确度的话,可以调用别人写好的一些API 。

咱们直接 win+r 弹出搜索框后输入 cmd ,点击确定弹出命令提示符窗口, 输入pip install ddddocr 即可安装。

不会的话详细参考我置顶文章有详细讲解。

代码展示

代码不多,非常简单。

模块安装好之后咱们先导入一下:

  1. import ddddocr

然后实例化一下,用一个 cor 接收一下这个数据。

  1. ocr = ddddocr.DdddOcr()

我这里准备了四个验证码:

首先我们用 with open 来读取一下这文件,读取方式使用 rb ,因为是图片的话就读取它的二进制数据

  1. with open('img_3.png', 'rb') as f:

使用 f.read() 将数据读取出来,再自定义一个变量接收一下。

  1. img_bytes = f.read()

然后我们通过 classification 将它传进去,把结果打印出来就可以了。

  1. result = ocr.classification(img_bytes)
  2. print(result)

实现效果:

纯数字的

字母+数字的

可以看到都完整的识别出来了,即使上面有一些花里胡哨的横线啥的。

完整代码

  1. import ddddocr
  2. ocr = ddddocr.DdddOcr()
  3. with open('img_3.png', 'rb') as f:
  4. img_bytes = f.read()
  5. result = ocr.classification(img_bytes)
  6. print(result)

大家可以自己去试试,也可以直接应用在采集数据实践当中~

到此这篇关于利用Python实现简单的验证码处理的文章就介绍到这了,更多相关 Python验证码处理内容请搜索w3xue以前的文章或继续浏览下面的相关文章希望大家以后多多支持w3xue!

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号