必威体育Betway必威体育官网
当前位置:首页 > IT技术

【Python爬虫】 使用 tesserorc 进行 图像的识别 ---- 填坑总结

时间:2019-09-17 20:40:00来源:IT技术作者:seo实验室小编阅读:51次「手机版」
 

orc识别

   在使用tesserorc 时  博主也遇到了诸多问题   在经过 四处碰壁 与 资料查找后 最终安装成功,并成功的完成了图像识别 , 事后总结这这一条阳光大道 , 方法仅供参考  ,  希望 对 各位正处于到坑中的小伙伴们有所帮助  .   如果您有更好的方法 , 欢迎评论  或 留下 您的 传送门

1丶 先下载安装tesseract

           下载链接:http://digi.bib.uni-mannheim.de/tesseract

2 丶安装OCR:(安装成功后,配置好环境)

           勾选语言选项的时候,只要勾选需要的语言就好,不必要全选 不然安装的太慢了

 2.1 : 安装完毕后 进入cmd窗口进入安装程序路径下 执行命令:  tesseract -v    如果显示如下图,则表示成功

3 丶去下面网址找到 Python版本 和 window系统版本 相对应的  whl 文件

https://github.com/simonflueckiger/tesserocr-windows_build/releases

4丶文件下载成功后 : 进入项目文件下的执行下面的命令 ( filename 为 下载的 whl文件名)

   pip install filename.whl

显示安装成功提示就表示安装成功了:

5 丶 环境搭好后 就能对图像进行识别了:

 简单实例:
from PIL import Image
import tesserocr
# 创建一个Image 对象
image = Image.open('yzm.jpg')

# 调用方法image_to_text() ,完成Image对象的识别
resul = tesserocr.image_to_text(image)
print(resul)
print(type(resul))

 

相关阅读

德众金融教您识别山寨网贷APP套路

当前,P2P网贷行业正有序出清,行业环境进一步优化。尽管如此,在良币驱逐劣币的过程中,有一个问题由来已久,对行业、社会造成的影响

客知音电话机器人:语音识别引擎私有化部署保证企业数据

自各大社交巨头Facebook, Google等纷纷暴露出用户数据泄露的丑闻,公众对个人信息的安全问题变得异常敏感。对于企业而言,保障用户

Windows电脑无法识别USB设备怎么办?

您可能已经注意到,如果您使用USB设备并将其插入计算机,Windows会识别并配置它。然后,如果你拔掉它并将其重新插入另一个USB端口,Windo

讯飞输入法“方言发音人招募” 保护濒危语言提升方言

在许多人心中,一句句方言、一声声乡音,连接着一份份情感与一段段回忆。“乡音无改,你想把亲切的乡音留存下来吗?”6月12日

文字识别OCR全球权威测试成绩发布:中国包揽前五

11月20日,有OCR领域奥斯卡之称的国际文档分析与识别大会(ICDAR)数据集最新结果公布,中国高校及企业包揽排行榜前五。中国人工智能&ldq

分享到:

栏目导航

推荐阅读

热门阅读