各位大佬,请教一下验证码去除干扰线和矫正的问题,有图了😭

2018-12-19 17:53:31 +08:00
 KevinBu

最近在用 Python 做爬虫,碰到了这种验证码(降噪 /二值化处理后的)

现在想要将干扰线去掉,最好能矫正一下字符,不吝赐教。

2758 次点击
所在节点    Python
9 条回复
EvilCult
2018-12-19 18:49:38 +08:00
这干扰线.......
都跟字母的笔画一边粗了吧.......
这可咋整....
囧....
zuoyouTU
2018-12-19 18:56:15 +08:00
连续斜率?
arrow8899
2018-12-19 20:04:15 +08:00
这种只有切图了
as9t
2018-12-19 20:59:34 +08:00
深度训练
jdhao
2018-12-20 00:07:00 +08:00
建议深度学习训练模型,样本的话可以自己生成,尽量拟合真实样本,效果应该不错。
KevinBu
2018-12-20 09:07:50 +08:00
@EvilCult 是阿,跟字母差不多粗,怎么去噪都去不掉
KevinBu
2018-12-20 09:09:24 +08:00
@jdhao 这样训练模型是不是要挺长时间的
jdhao
2018-12-20 09:15:40 +08:00
@KevinBu 看你用 gpu 还是 cpu 训练,几十万样本,gpu 四五天可以跑完,cpu 就很慢了
boom7
2018-12-20 14:30:57 +08:00
前几天一个类似的验证码,搞了二十万数据,去腾讯云开了个 gpu 机器训练,两个小时跑完,最终测试的验证码通过率有九十多

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/519064

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX