验证码二值化最佳阀值的选取

2015-01-22 16:50:57 +08:00
 darmody

最近由于需要研究验证码的识别,有2种级别的验证码需要破解:
1. 有噪点,干扰线与字符颜色不同,字符整齐
2. 无噪点,干扰线与字符颜色相同,字体扭曲,位置横向不定

显然1级别的比较好搞定,但是我选取的阀值二值化出来的图片只能满足一半的图片是干净的,关于去噪点,二值化取阀值,有什么好的算法以及学习的途径?好书好教程求推荐啊。我现在知道的有迭代,大津这些算法,但实际应用中算法应该有所调整吧,思路应该是?

2级别的还没有研究到,感觉很麻烦,同求解题思路啊!

2556 次点击
所在节点    机器学习
10 条回复
WildCat
2015-01-22 16:55:18 +08:00
虽然我自己都用错,但是还是默默地提醒下: “阈值”,“阀门”
darmody
2015-01-22 16:55:50 +08:00
@WildCat 是这样的吗。。。
hackwjfz
2015-01-22 16:56:02 +08:00
@WildCat
哈哈,我进来也想评论 阈值
NeoAtlantis
2015-01-22 17:02:21 +08:00
http://wenku.baidu.com/view/63bac64f2b160b4e767fcfed.html

一种通用的去除文字图像中干扰线的算法


好多年前认识的一个小伙伴(嘛他大概不记得我了吧)就引用过。


然后,阈(yu4)值……
darmody
2015-01-22 17:21:30 +08:00
好吧好吧。。你们不要吐槽了。。
zpvip
2015-01-22 22:30:22 +08:00
@darmody
我是做网站的,我想问一下哪种验证码不容易被你们破解?
haoawesome
2015-01-23 06:12:11 +08:00
haoawesome
2015-01-23 06:15:12 +08:00
问题已传送到微博@好东西传送门 http://www.weibo.com/5220650532/C0Ryi36B6?ref=
darmody
2015-01-23 12:30:48 +08:00
@haoawesome 看起来很不错!不管怎样先刷个感谢!
darmody
2015-01-23 12:31:27 +08:00
@zpvip 人眼都很难识别的。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/164538

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX