你们猜 12306 这次的图片验证码做了多大的库?

2015-03-16 12:19:45 +08:00
 b821025551b

https://kyfw.12306.cn/otn/passcodeNew/getPassCodeNew?module=login&rand=sjrand&0.9516795550007373
小爬了1000个,就找到2个重复的,雪碧&耳环

5518 次点击
所在节点    问与答
24 条回复
goodbest
2015-03-16 12:25:28 +08:00
你是要人肉判定是否重复的么?
lsmgeb89
2015-03-16 12:30:59 +08:00
是不是准备上 Machine Learning 来破验证码啦?
xiaogui
2015-03-16 12:31:23 +08:00
记得好像有统计学公式大致推算出来
jacy
2015-03-16 12:33:42 +08:00

这么多图,丧心病狂
Anybfans
2015-03-16 12:35:07 +08:00
这图真尼玛丧心病狂啊,真心看不懂。。。。。
m939594960
2015-03-16 12:35:37 +08:00
这破玩意 百度识图 一个一个识 基本 就行了把
goodbest
2015-03-16 12:47:23 +08:00
@jacy 竟然已经上叠加词语组合了..
Phariel
2015-03-16 12:49:01 +08:00
是否要掀起新一轮图像识别学习热潮啦 233
loading
2015-03-16 12:52:12 +08:00
如果内容是用 google 图片搜索的结果生成的,理论上可以做到无限大。
前提是图片搜索结果准确!
lshero
2015-03-16 12:53:23 +08:00
万一在自动随机加个特效滤镜什么的
niboy
2015-03-16 13:06:45 +08:00
只要所有图库能爬下来的话,估计识别问题不大
a591826944
2015-03-16 13:42:01 +08:00
@loading 用 google 这个思路很赞啊。。google 前面的图片 还是非常准的
BGLL
2015-03-16 13:43:51 +08:00
测试 http://cloudsightapi.com/api 的机会来了
wy315700
2015-03-16 14:36:00 +08:00
有个生日悖论

在一个库里,重复的概率比一般想象中的要大得多
b821025551b
2015-03-16 14:51:19 +08:00
@jacy 有叠加?我还没发现过这样的
walleL
2015-03-16 14:52:53 +08:00
@niboy
图片也可以变化的啊
就像 @lshero 说的
再加个干扰线,扭曲,变形什么的。怎么破。。
lxrabbit
2015-03-16 16:01:41 +08:00
@walleL 我突然联想到了问的问题是不是也可以变换,例如要求选择"一个微笑男人的头像和一个哭泣的女人的头像",或者"选择一个六角形螺丝和十字形螺丝"
或者,也可以把问的问题改成包含图片的,例如:"选择一个苹果和一个带有齿轮图案的"(这里齿轮是一个齿轮的照片,答案则可以是国徽)
imn1
2015-03-16 16:06:16 +08:00
个人觉得不是12306的产品
aalska
2015-03-16 16:23:16 +08:00
挺先进的
stupidcat
2015-03-16 16:26:50 +08:00
就没人根据“1000次里只出现2次重复”来估计一下规模么

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/177230

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX