node 中使用 tesseract.js 会报错

2017-10-25 10:46:38 +08:00
 messi1991

我根据官网上使用 tesseract.js 时会报错, 这个是我的代码

var Tesseract = require('tesseract.js');
Tesseract.recognize("1.jpg")
	.then(function(result){
        console.log(result)
    });
    

下面是报的错误

pre-main prep time: 64 ms
events.js:182
      throw er; // Unhandled 'error' event
      ^

Error: connect ETIMEDOUT 75.126.150.210:80
    at Object.exports._errnoException (util.js:1024:11)
    at exports._exceptionWithHostPort (util.js:1047:20)
    at TCPConnectWrap.afterConnect [as oncomplete] (net.js:1150:14)

求大神帮看一下是啥原因,万分感谢

6082 次点击
所在节点    Node.js
7 条回复
TabGre
2017-10-25 12:27:29 +08:00
字面上看,连结网络错误,这是啥库呀
messi1991
2017-10-25 12:31:38 +08:00
@TabGre 这个一个图像识别的库,我爬虫打算用和这个识别验证码,但是在官网上的代码在本地运行,就报这个错误
kenshinji
2017-10-25 15:09:53 +08:00
程序需要连的这个 ip 是墙外的么?如果是的,估计是因为开会
messi1991
2017-10-25 15:20:51 +08:00
@kenshinji 主要我现在是可以去墙外的,不过我访问不了这个 ip,估计是他们服务瘫了
toono
2017-10-25 16:47:04 +08:00
js 这个库需要连接语言库之类的资源。

我还是建议你这种解析图片的工作在后台服务做吧,我用过它的 Python 版本,应该也会有 Java 版本吧。
zomco
2017-10-25 20:13:09 +08:00
感觉是.traineddata 文件的问题
jeneser
2017-10-25 20:58:04 +08:00
爬虫? `tesseract.js`并不适合你要做的事情。
识别验证码的话推荐**tesseract-ocr** `https://github.com/tesseract-ocr/tesseract`。可以训练数据以识别自定义语言。Node,推荐`https://github.com/desmondmorris/node-tesseract`这个包。
demo 可以参考一下。`https://github.com/hpufe/fsociety-hpu`

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/400505

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX