识别图片中的文字与数字

2020-09-28 11:44:36 +08:00
 legendnan
大佬们,我想识别一个图片中的数字,他是网页上的我想给他截图保存下来。然后用程序去识别他里面的数字。请问这个识别率高的库都有什么?
3087 次点击
所在节点    Go 编程语言
8 条回复
xylophone21
2020-09-28 11:51:38 +08:00
Google mnist PyTorch, 大把代码跑到 9X%+,X 大概是 5678
rimutuyuan
2020-09-28 11:53:32 +08:00
百度智能云 ocr 识别 api,一天很多次免费额度
supermoonie
2020-09-28 11:55:03 +08:00
飞浆
miaomiao888
2020-09-28 12:53:36 +08:00
试试 PandaOCR 各种 OCR 引擎自个挑
但如果想要离线库那没啥可推荐的,识别效果基本都不如在线的
shm7
2020-09-28 13:00:51 +08:00
你放在 go 这个主题下,让我不晓得怎么回答。

第一你这里的截图是什么样的不知道,不晓得识别难度。如果是比较规整的,肯定比歪歪斜斜的好识别。沙发说什么 9X%我觉得可能是微信号看多了。谷歌最赚钱的 youtube 的机器翻译也只能适合慢速不带口音的翻译。稍微复杂一点的情况,错误也会频繁出现。

如果你懂 DL/CV,可以看看 attentionOCR 这种端到端的模型,在歪斜形变的场景也能保持一定的识别率。但是问题是没有中文的训练数据,英文数字应该有。有个同事做过这方面的事情,我有点耳闻。
shm7
2020-09-28 13:03:26 +08:00
谷歌有过一个识别规整英文数字验证码的开源方案,比较老了,叫 tesseract (对,就是雷神那个东西)。你可以试试。我们这边做验证码识别不太行。
legendnan
2020-09-28 14:34:24 +08:00
@shm7 图片是带有颜色的,绿色黄色橙色等根据数字大小来确定颜色。主要是想用 go 写就发在这里了。识别内容就是数字。到现在我也不会在 V2EX 上发图片。要不就发图了
z21victor
2020-10-14 15:47:02 +08:00
如果只是英文和数字,github.com/otiai10/gosseract 这个应该是可以的。中文的话,基础的模型识别效果都不太好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/711200

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX