话说 Python 调用 OCR 有什么比较成熟的方案吗?

2020-10-25 16:55:31 +08:00
 black11black
如题,有大量漫画图片需要识别,每张图是纯色背景,上面是印刷体的字(数字版,非扫描),含有中文、英文、日文。

请问有成熟的 OCR 方案吗?最好是 python 的,因为撸起来比较快,没有的话 java 也行
2408 次点击
所在节点    问与答
13 条回复
just1
2020-10-25 16:59:48 +08:00
成熟当然是调 api
black11black
2020-10-25 17:03:10 +08:00
@just1 没有本地开源的方案吗,api 主要问题是 qps 跟不上
renmu123
2020-10-25 17:41:08 +08:00
pytesseract 你想要开箱即用的话只有找成熟的 api
yangyaofei
2020-10-25 19:31:57 +08:00
cnocr
djoiwhud
2020-10-25 19:34:19 +08:00
估计只能花钱买付费的。免费的东西准确率估计非常低。当然,你的需求估计付费的准确率也不会很高。
longbye0
2020-10-25 21:05:09 +08:00
minami
2020-10-25 21:50:03 +08:00
百度的 paddleocr
xchaoinfo
2020-10-25 23:15:52 +08:00
有 GPU 的话,自己网上找个 pytorch 项目训练下,
没有的话,tesseract 自己训练下,识别率还可以,就是慢,pytesseract 可以调用
免费的 API 有限制,付费吧
black11black
2020-10-26 06:15:26 +08:00
@jackrelative 感谢回复,我感觉我这已经是实验室环境了,纯色背景+字,对 OCR 这个领域没什么了解,做的这么菜的吗。
Hconk
2020-10-26 08:54:42 +08:00
chineseocr,你这种非自然场景的印刷体不要太简单。
Hconk
2020-10-26 08:58:24 +08:00
@Hconk 日文不行。
black11black
2020-10-26 10:21:31 +08:00
@Hconk 有成熟的开源项目吗,中文的
Hconk
2020-10-26 16:29:30 +08:00
@black11black github 搜一下就有,chineseocr

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/718396

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX