求一个pytesser3下载

pytesser3 | 无名博客Python3导入pytesser包报错了请问下是哪里错了。
[问题点数:40分,结帖人yeyonglu86]
本版专家分:0
结帖率 66.67%
CSDN今日推荐
本版专家分:5014
2016年12月 其他开发语言大版内专家分月排行榜第一
本版专家分:0
匿名用户不能发表回复!|
其他相关推荐你有看见我弄丢了的那只喵吗
> 造新轮子啦,让pytesser支持3.x啦~
曾经用2.x版本的Python写过一个小小的验证码识别小程序,不到三十行,用的是pytesser 但是pytesser仅仅支持2.x版本,因此我们需要将这个轮子改写为3.x,方便我们调用。
(等不及的小伙伴可以直接pip install pytesser3 即可完成轮子的安装)
0x01 改写的时候遇到的坑
很多2.x能用 而3.x不能用的情况发生,比如引用的包发生改变 (import PIL 改为from PIL import Image) print 改变 except 一些修改,改好了以后,才到了 这个傻逼包内置的tessract用不了的问题,你需要自己安装Google 的图像识别引擎:Tesseract OCR网上有exe安装包
我这里为了方便大家就提供一下。
pypi打包的坑,本文重点是这个。
这是我的目录大纲,一级是pytesser3 和一些readme setup.py文件 二级是__init__.py等py文件 ,不过还有一些其他的如图片文件 tif 字体文件,在二级目录还包含着 三级目录 等 那我是这么做呢可以看一下下面我的代码
from setuptools import setup, find_packages
name = 'pytesser3',
version = '1.0.1',
keywords = ('pytesser', 'support 3.x'),
description = 'modify and let it support 3.x',
license = 'MIT License',
install_requires = ['requests'],
author = 'LouisSong',
author_email = '',
packages = find_packages(),
package_data = {
# If any package contains *.txt files, include them:
'': ['*','tressdata/*],#看这里就好啦,就可以吧里面的都包含进来
# And include any *.dat files found in the 'data' subdirectory
# of the 'mypkg' package, also:
platforms = 'any',
123456789101112131415161718192021222324
from setuptools import setup, find_packages&setup(&&&&name = 'pytesser3',&&&&version = '1.0.1',&&&&keywords = ('pytesser', 'support 3.x'),&&&&description = 'modify and let it support 3.x',&&&&license = 'MIT License',&&&&install_requires = ['requests'],&&&&&author = 'LouisSong',&&&&author_email = '',&&&&&packages = find_packages(),&&&&package_data = {&&&&&&&&# If any package contains *.txt files, include them:&&&&&&&&'': ['*','tressdata/*],#看这里就好啦,就可以吧里面的都包含进来&&&&&&&&# And include any *.dat files found in the 'data' subdirectory&&&&&&&&# of the 'mypkg' package, also:&&&&},&&&&&&platforms = 'any',)
第二个坑,网上都喜欢一个二个的告诉我说 先去官网pypi注册一下,然后运行
python setup.py register
但是我运行了一会,就报错说需要byte like 不是str 请看源码 我本身就造了一个轮子心情好得很 我还要再造一个么肯定不行,那就换一个上传工具 我们先安装twine 然后运行一下代码即可
twine upload -r pypi dist/*
twine upload -r pypi dist/*
我自己测试了一下 可以用 pip install pytesser3,如图
同时内置code.py 检测这个轮子是否好用
需要注意的是,务必安装google的Tesseract OCR 最好默认安装 谢谢
另外:PIL这个坑自己去踩,谢谢~
源码地址:
期待你的star
转载请注明: &
or分享 (0)有没有python3 的pytesser_百度知道
有没有python3 的pytesser
答题抽奖
首次认真答题后
即可获得3次抽奖机会,100%中奖。
天天不看java知道合伙人
来自电脑网络类芝麻团
天天不看java
采纳数:5015
获赞数:2057
参与团队:
PIL安装:pip install Pillow&pytesser3下载地址:&Tesseract OCR engine下载地址:&(Tesseract OCR engine具体安装方法:)&安装完成之后将pytesser3解压,放置E:\Python\Lib\site-packages目录下&简单使用:
为你推荐:
其他类似问题
您可能关注的内容
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。其实也不算自己写的,在网上东找找西找找,合一块问题就解决了。和谐社会的程序猿不都这样么。。上正菜。先安装pillowwindows 10上面先打开命令提示符:注:不知道为啥我装python 3.5的时候蛋疼的选择了管理员安装,所以运行命令提示符的话也需要管理员权限。怎么操作就不说了。1. 安装Pillow2. 安装pytesseract3. 再安装tesseract-ocr,注意这个很关系是的核心程序。报错了,看来前面太顺了,python看不过去了。至于报错的信息:error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools让我去这个网站装
Microsoft Visual C++ 14.0相关的东东,N N D 我打开网站,下载之后安装,看所需要的空间 4GB。玩不起,还是算了,我是菜鸟,太多的东西不懂,所以不要为难我。所以找其它方法装tesseract-ocr这里面有tesseract-ocr for windows的安装方法。安装步骤我们强大的度娘就有:http://jingyan.baidu.com/article/219f4bf788addfde442d38fe.html 安装时要什么字库自己选。懒人连接:https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exeMAC
WINDOWS 各版本下载https://github.com/tesseract-ocr/tesseract/wiki相关的程序基本安装完了。开始做一个小程序参考图如下:我是在pycharm中练习的,代码如下:from PIL import Image
import pytesseract
img = Image.open()
text = pytesseract.image_to_string(img)
print (text)注:我把上面的参考图命名为22.png了,因为我太2了装好几个程序了,看看效果运行:"C:\Program Files\Python35\python.exe" D:/Python_Study3.5/test/pli_png.py
Traceback (most recent call last):
File "D:/Python_Study3.5/test/pli_png.py", line 4, in &module&
text = pytesseract.image_to_string(img)
File "C:\Program Files\Python35\lib\site-packages\pytesseract\pytesseract.py", line 122, in image_to_string
config=config)
File "C:\Program Files\Python35\lib\site-packages\pytesseract\pytesseract.py", line 46, in run_tesseract
proc = subprocess.Popen(command, stderr=subprocess.PIPE)
File "C:\Program Files\Python35\lib\subprocess.py", line 676, in __init__
restore_signals, start_new_session)
File "C:\Program Files\Python35\lib\subprocess.py", line 957, in _execute_child
startupinfo)
FileNotFoundError: [WinError 2] 系统找不到指定的文件。M D 找不到指定文件,到这里我也不懂,继续百度。然后找到的文章说要更改 pytesseract.py这个文件的一些配置(第二个安装的模块)。因为这里面配置有一些相关于tesseract-ocr(即第三个安装的程序)更改如下:在pycharm中如图打开pytesseract.py:在右边打开的窗口找到:tesseract_cmd 这行代码:这一行注释掉:因为pytesseract.py文件内默认的tesseract-ocr的主程序环境变量不知道怎么变的,到了windows 下面就不能运行,上面执行的报错代码中找不到文件,其实就是找不到主程序。所以注释掉原来的,我们再新加一行。上面的路径就是你安装Tesseract-ocr程序时的路径:#tesseract_cmd = 'tesseract'新增加一行:tesseract_cmd = r'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'保存,运行我们写的代码,看看效果。又报错了,伤不起"C:\Program Files\Python35\python.exe" D:/Python_Study3.5/test/pli_png.py
Traceback (most recent call last):
File "D:/Python_Study3.5/test/pli_png.py", line 4, in &module&
text = pytesseract.image_to_string(img)
File "C:\Program Files\Python35\lib\site-packages\pytesseract\pytesseract.py", line 125, in image_to_string
raise TesseractError(status, errors)
pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\
Tesseract-OCR\\eng.traineddata')
Process finished with exit code 1这次报的错,貌似是找不到tesseract-ocr的配置文件。看来还得改pytesseract.py文件。于是又从网上找了一些东西,继续更改。如图保存,接着运行程序:啥啥成功了,虽然识别多了一个小数点,不过至少不报错了。就试到这里了,多的我也不会。以上大部分内容都是来自网上。我不过做下整理。那里说错了,莫怪,我了解的也不多。
声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至: 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

我要回帖

更多关于 精灵宝可梦日月求下载 的文章

 

随机推荐