OCR 如何准确识别字母和数字的组合?

2017-05-21 23:56:35 +08:00
 woshichuanqilz

比如我这幅图识别就比较困难各位有什么办法吗?

4903 次点击
所在节点    问与答
6 条回复
LuckCode
2017-05-21 23:59:43 +08:00
添加白名单?或是叠加一个移位的图层?
fffflyfish
2017-05-22 00:04:49 +08:00
图像的连通域分析可以识别
eastpiger
2017-05-22 00:04:55 +08:00
大一的时候做过一个 OCR 相关的项目,只能算入门的渣渣。。。。

有一些办法,最粗暴的莫过于找大量的数据扔 CNN,有一种杀鸡用牛刀的感觉,当然数据量足够大的话确实是有效果的,我们当时做的车牌的识别就是这么做的。

第二类方法就是传统 OCR 的一些形式,如果能确定这个数字的变化不是很多的话,可以在 x 和 y 轴,甚至斜对角求一下积累量,根据这个数据来进行区分,这种算法 naive 得很但是对于字母数字还算是比较有效地(对中文就是废了。。)
wheeler
2017-05-22 00:24:24 +08:00
这种没有粘连的字符还是比较好识别的,不知道题主是想自己造轮子还是单纯的求解决方案。

就这种图而言,可以 label 后,求 bounding box 把字符分割出来。
如果字符本身不是很复杂的话(比如噪声,倾斜什么的),直接用模板匹配就可以了。

如果只是求解决方案的话,类似于 tesseract ( https://github.com/tesseract-ocr/ )的 OCR 很多啊,还可以针对自己的样本集训练。
KaoN
2017-05-22 06:56:23 +08:00
正在集成一个 ocr 项目,字母+数字..正如三楼所说..扔给 cnn...
WayToPlay
2017-05-22 11:53:08 +08:00
@wheeler tesseract 这么多年了,其实没啥改进,英文和数字还好点,中文识别慢的要死,准确率也低.
这些都不算啥,关键是容易 Native crash.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/362847

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX