今天抽空做了个 3-8 位验证码识别模型,发现正确率可以 98%,好奇如果我把这个模型做成 API 服务会有人用么,以及再设计一种对抗识别的算法(类似 recaptcha)

2021-05-21 14:54:05 +08:00
 dick20cm
5541 次点击
所在节点    奇思妙想
36 条回复
shawnbluce
2021-05-21 15:04:21 +08:00
验证码贴两个例子出来看看呐,看看是什么复杂度的
liprais
2021-05-21 15:04:59 +08:00
大概率 overfit 了
cnzjl
2021-05-21 15:13:30 +08:00
肯定有人用。灰产的
learningman
2021-05-21 15:13:42 +08:00
你是不是忘了咱们是中国人,验证码可以上中文的。。。
foil2
2021-05-21 15:15:19 +08:00
肯定有人用的,
参考下面👇👇👇这个成熟的打码平台
http://www.damagou.top/index.html
Puteulanus
2021-05-21 15:46:56 +08:00
现在对抗的已经快到人都做不出来的程度了
https://www.163.com/dy/article/G6CNEFDF0526Q3CJ.html
westoy
2021-05-21 15:50:16 +08:00
会有法律风险吧

要有哪个大平台被薅狠了走法律程序你肯定是共同被告啊.....
dick20cm
2021-05-21 16:45:34 +08:00
@liprais 没有 overfit,贴个 f1_score 你瞧瞧
[6] 0.988 [['^', '0.000'], ['0', '0.941'], ['1', '0.976'], ['2', '0.981'], ['3', '0.985'], ['4', '0.985'], ['5', '0.984'], ['6', '0.985'], ['7', '0.967'], ['8', '0.981'], ['9', '0.990'], ['a', '0.988'], ['b', '0.977'], ['c', '0.983'], ['d', '0.964'], ['e', '0.988'], ['f', '0.988'], ['g', '0.992'], ['h', '0.991'], ['i', '0.977'], ['j', '0.982'], ['k', '0.987'], ['l', '0.974'], ['m', '0.985'], ['n', '0.972'], ['p', '0.986'], ['q', '0.988'], ['r', '0.980'], ['s', '0.991'], ['t', '0.982'], ['u', '0.985'], ['v', '0.984'], ['w', '0.985'], ['x', '0.990'], ['y', '0.987'], ['z', '0.985'], ['$', '1.000']]
dick20cm
2021-05-21 16:46:02 +08:00
@learningman 感觉识别中文也可以 95+%
dick20cm
2021-05-21 16:46:22 +08:00
@foil2 可怕,第一次见这种灰产网址
dick20cm
2021-05-21 16:46:48 +08:00
@Puteulanus niub,这种大概是用游戏引擎渲染出来的
dick20cm
2021-05-21 16:47:11 +08:00
@westoy 是,所以只是想法并没有实践
tfdetang
2021-05-21 16:59:44 +08:00
只是 3-8 位的数字英文识别大家都做的很成熟了吧,现在用这种验证码的也少了,搞头不大。 以前公司需要有做过英文数字的,还有点选的。点选的稍微难点,但是也不是很难攻克。 不过后来觉得打码平台也不贵,自己做还要花人力维护出机器,实在划不来
ch1ps79
2021-05-21 17:28:16 +08:00
有网址吗
yunyuyuan
2021-05-21 17:30:33 +08:00
每次想下载战网打打 OW,就想到了被验证码支配的恐惧,感谢网易帮我戒网瘾
securityCoding
2021-05-21 17:31:31 +08:00
@Puteulanus cloudflare 人机检测每次都是找汽车 /自行车 ,还 tm 翻页,太过分了
dick20cm
2021-05-21 17:36:10 +08:00
@ch1ps79 还没做呢,来找大家探讨一下这个东西的实际价值,改天有空我会 publish 出来
otakustay
2021-05-21 18:14:58 +08:00
@securityCoding 你每一次做这个都成为他们的 AI 的训练素材,老工具人了
Stain5
2021-05-21 18:16:02 +08:00
一和那些七七八八的验证系统比 recaptcha 真的是我见过最友好的了
tabris17
2021-05-21 18:18:15 +08:00
@westoy 伪装成普通的 OCR 服务呗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/778373

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX