求教,有图片 orc 文字的开源库吗?

2017-06-12 10:21:03 +08:00
 lixuda
3802 次点击
所在节点    Python
14 条回复
ayconanw
2017-06-12 10:28:00 +08:00
popok
2017-06-12 10:30:43 +08:00
想说的是 ocr 吧?
littleylv
2017-06-12 10:41:15 +08:00
1 楼说的那个我试过,对英语还行,其他语言不是很准。
推荐 google cloud 提供的 api,准确率很高。
https://cloud.google.com/vision
https://github.com/GoogleCloudPlatform
y051313
2017-06-12 10:45:49 +08:00
google vision 我碰到的问题是不能判断段落。它是把每一个换行都当成一个句子的结束。
duola
2017-06-12 10:49:57 +08:00
百度有一个,感觉准确率也很高。
lancegin
2017-06-12 11:11:02 +08:00
@duola 百度的开源吗?之前他们出过一款 涂书笔记 用的应该就是他们的 ocr 库,但是不知道什么原因下架了
duola
2017-06-12 13:09:39 +08:00
@lancegin 不开源,可以参考体验一下。http://ai.baidu.com/tech/ocr/general
kingcos
2017-06-12 14:06:34 +08:00
@duola 百度这个挺厉害。。我用我们教务系统那种有噪点的图测试一下,识别率挺高
also24
2017-06-12 14:28:58 +08:00
http://www.zmonster.me/2015/06/10/baidu_ocr_api_usage.html

不知道为啥,一说起百度的 OCR 我就想起这份测试里的最后一个样例
also24
2017-06-12 14:32:02 +08:00
lonelygo
2017-06-12 16:59:54 +08:00
https://github.com/tesseract-ocr/tesseract
4.0 支持 LSTM 了,默认识别参数挺多,可以理解下都测试比较下用途。
默认有中文,觉得不好用的话,中文可以自己考虑训练。
https://github.com/JinpengLI/deep_ocr
这个没用过,看 readme.md 说是中文效果不错,你可以试试看,对比下。
mingyun
2017-06-12 23:49:39 +08:00
https://github.com/netpi/baidu-ocr-api npm install baidu-ocr-api -g
Khlieb
2017-06-13 10:18:08 +08:00
Khlieb
2017-06-16 15:01:39 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/367735

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX