想问一下:这样的验证码该要怎么识别?

2016-07-25 08:47:52 +08:00
 panda0

用 tesseract 试了几个,识别率 0%

请教大神,大概的研究方向是什么?

6728 次点击
所在节点    Python
35 条回复
YAFEIML
2016-07-25 09:19:47 +08:00
人工智能
somkanel
2016-07-25 09:56:17 +08:00
所以每次遇到这种时候,就使劲换……
lcatt
2016-07-25 09:56:41 +08:00
tesseract 不是可以自己训练字库么。。
fcicq
2016-07-25 10:07:17 +08:00
把线去了, 反白应该问题不大
aprikyblue
2016-07-25 10:09:10 +08:00
起码肉眼可以识别出来。。



这种我人工都要输入好几次。。
wuhang89
2016-07-25 11:14:41 +08:00
跟你讲,不要把人工智能的 OCR 想的多厉害,像这个最佳的解决方案是人肉打码。
h4x3rotab
2016-07-25 11:38:25 +08:00
这种 tessrect 不可能识别的出来,基本只要不接近印刷体,或者稍微有点粘连 tess 就不行了。如果你能人工打 20w 个码,我可以给你做出识别
aeshfawre
2016-07-25 11:39:40 +08:00
人工打码是最实际的解决方法, 网上有收费接口.
用计算机应该也能实现自动识别,不是有个公司破了 yahoo 验证码,挑战 decaptcha 么, 好像就是 deepmind 这个公司吧.
menc
2016-07-25 11:52:41 +08:00
用 RNN + sliding window , recaptcha 都能 98%的 accuracy ,你这个不是什么大事情
aeshfawre
2016-07-25 12:04:59 +08:00
@menc 赶紧给楼主做一个,比起人工打码,楼主付个 5000 大洋给你,估计还是愿意的.
gkiwi
2016-07-25 12:11:57 +08:00
@menc 有相关的文章推荐么?
goubenger
2016-07-25 12:16:39 +08:00
这种验证码应该已经有成熟的技术了。
不预处理光跑 tesseract 准确率肯定不行的
ihciah
2016-07-25 12:25:55 +08:00
手动框出来, fast-rcnn 做;或者无脑直接丢 CNN ,打多个 label 出来,实测比楼主的复杂的多的图直接用 VGG19 finetune 可以到 90+%;或者用 RNN 、 LSTM 那一套,戳 http://arxiv.org/abs/1412.7755
menc
2016-07-25 13:30:56 +08:00
@gkiwi 有几篇论文,是用 RNN 、 CNN 来做 recaptcha 的识别的。
http://www.cs.columbia.edu/~polakis/papers/sivakorn_eurosp16.pdf

其他关键字

Multi-digit Number Recognition from
Street View Imagery using Deep Convolutional Neural Networks

Deep Features for Text Spotting


@aeshfawre

给我 10k ,给你一个 90%以上 accuracy 的这样的验证码的识别
iVanilla
2016-07-25 13:53:13 +08:00
能被识别是因为这些验证码太弱,不信看看这样的验证码你怎么识别?

menc
2016-07-25 14:28:35 +08:00
@iVanilla 你这个比他给的简单多了
iVanilla
2016-07-25 14:33:52 +08:00
@menc 你确定?那你写个识别程序试试看。
menc
2016-07-25 14:38:15 +08:00
@iVanilla

麻烦,这样吧,你给的两种验证码,各 2k rmb 做赌注,单字 90%以上的准确率。
写出来你给我钱,写不出来我给你。

有偿找个第三方来见证也行。
gonglin
2016-07-25 14:48:54 +08:00
@menc 我做第三方 ~~
maomaomao001
2016-07-25 14:49:31 +08:00
自己用眼睛看啊。。。别老想着破坏

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/294660

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX