锤子官网的这个验证码是如何生成的?

2017-11-08 20:23:31 +08:00
 asuraa

感觉用户识别很容易,机器识别不容易啊。 这个有啥窍门?

https://account.smartisan.com/#/v2/login

4967 次点击
所在节点    程序员
17 条回复
takanasi
2017-11-08 20:32:46 +08:00
先生成字符然后从字符里随机取像素散布到椭圆的范围内?
hfenger
2017-11-08 21:02:21 +08:00
很多方法,比如先绘制一个淡紫色椭圆,然后在椭圆内随机画紫色点 ,然后画紫色验证码 然后全图随机画白点,细节自己控制了,反正我不会画这种验证码,太好识别了,不如多画几条干扰线
hfenger
2017-11-08 21:05:56 +08:00
刷新了几下,颜色是随机的,不一定非要紫色
hugee
2017-11-08 21:06:24 +08:00
二值化,不是很难吧?
nazor
2017-11-08 21:19:22 +08:00
机器识别不难,用 Tensorflow 训练,像百度网盘验证码这样的扭曲也能有 80%的正确率。
https://pan.baidu.com/genimage?00000000000000000000000000000000
lianz
2017-11-08 21:19:38 +08:00
没什么难的,简单过滤一下颜色然后二值化,简直不要太轻松 easy
Luckyray
2017-11-08 21:39:34 +08:00
@nazor 这个我感觉人都不一定能有 80%……
asuraa
2017-11-08 22:29:33 +08:00
这。。。这么好识别?
asuraa
2017-11-08 22:31:26 +08:00
m939594960
2017-11-08 22:31:47 +08:00
@nazor 你这个接口厉害了 怎么找到的
t123yh
2017-11-08 23:30:45 +08:00
@nazor 百度这个实际上识别更容易,同样的内容,可以生成不同的图片,多识别几次,保证 100% 正确率
nazor
2017-11-08 23:55:54 +08:00
@luodaoyi 其实主要问题是怎么获得训练集,如果有 3W 左右,应该能达到不错效果。
nazor
2017-11-08 23:58:07 +08:00
@m939594960 百度网盘的,偶然发现。
nazor
2017-11-08 23:59:24 +08:00
@t123yh 是的,100%现在达不到,80%已经实现了,而且只是训练了 2000 个不同验证码,共 5W 张左右。
crab
2017-11-09 00:15:00 +08:00
@nazor 打码平台
LeeSeoung
2017-11-09 09:35:51 +08:00
- -这种机器识别 做到 90 可以的。。没有太多干扰
asuraa
2017-11-09 13:32:35 +08:00
说明干扰线还是很有用的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/404723

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX