imn1
2015-03-17 18:07:35 +08:00
这种验证码的非人工破解很难
几个月之前在某验证码的帖子我说过,现时的验证码思想只是把“机器抄写”转为“人工抄写”,这个确认是否“人类”是不足够的,需要加入人的思考
而12306的这次新验证码就达到这条,这里至少有两次思考过程,1.阅读理解(简体)汉字;2.从文字意思到影像
所以前面各位都在讨论图像识别是找错方向,其中 #17 提到以图找图对人是难了,因为前面增加了一个“从影像到文字”的理解过程,但对计算机却是省了“理解文字”这个过程,反而简单了
只要做很小的升级,就足以击败图像识别了
例如:不写“水表”,写成“用于测量用水量的仪器”,要知道这样的描述性文字比起“水表”两字变化就多了
“测量” -> “计量”、“计算”、“记录”……
“用水量” -> “水容积”、“耗水量”、“流量”、“用水立方数”……
“仪器” -> “仪表”、“工具”、“计量器”……
如果机器不带人工智能理解汉语的话就只能暴力破解了
图像做成不干扰视觉观看,但干扰数字分析的多帧 gif 就更有趣了