高德地图/淘宝,阿里的验证码用 selenium 效果不是很好呀?

2018-11-25 15:47:08 +08:00
 louhang

最近在做高德地图 poi 的采集,有时会出现“休息一会”的滑块验证码,发现尽然和淘宝的一样,用 selenium 去模拟的时候发现就算添加了鼠标抖动,滑动速度拟人化的操作之后返回的还是验证失败,点击重试,有大佬解决过这种问题的吗?!!

4313 次点击
所在节点    Python
10 条回复
Northxw
2018-11-26 00:24:45 +08:00
假设你遇到的是极验, 你以为极验验证很容易吗, 机器学习加上千万个人机样本, 就是给你这种人用的, 哈哈😄
louhang
2018-11-26 16:35:39 +08:00
@Northxw 极验的还真没有阿里的这个难,我拿着这套操作骗过了极验但是没骗过阿里的滑块验证。
cxbanana
2018-11-26 17:45:11 +08:00
因为阿里会进行 selenium 检测 只要发现你是通过 selenium 驱动的 不管怎么样都要滑块验证 而且手动滑都通过不了
tanglijun
2018-11-26 18:09:39 +08:00
@cxbanana 群里看到有人用 slenium 通过了天猫滑块验证(视频)!我觉得应该是与 selenium 操作滑块速度有关吧!!
Northxw
2018-11-26 19:31:08 +08:00
@louhang 哈哈 也是哦,一个加速度公式就 ojbk 了。 不过京东(只知道京东)你用 selenium 驱动,就会出现滑块验证,前提是你清除 cokkies 等,亲测。
cxbanana
2018-11-27 08:54:24 +08:00
@tanglijun 是么~ 可能网站不同,我登录的是阿里钻展,里面 js 文件会进行 selenium 检测,然后直接用 fiddler 捕获更改请求的 js 文件 就不会出现滑块验证了
louhang
2018-11-27 09:59:54 +08:00
@cxbanana 我发现用 selenium 添加代理之后会有很大几率不出现滑块验证,我的初衷是想用 selenium 去滑动验证码通过之后获取 cookie 中的一个 x5sec 参数,如果用 requests 发送 url 链接不带这个 cookie 的话,可能会访问 10 几次就会给你重定向到滑块验证页面,所以很纠结呀!!!!!
cxbanana
2018-11-27 10:29:20 +08:00
@louhang 这个你可以捕获一下请求的 index.js 文件 看下里面是否会进行 webdriver 的判断,如果会进行判断的话,就下载该 js 文件,把 webdriver 字段的判断返回由 True 改为 Flase 后另存为一个文件,然后用 fiddler 捕获请求 index.js 文件的接口,将该文件进行替换,这样就应该不会出现滑块验证了。
515576745
2018-12-26 18:13:29 +08:00
有没有大佬解决了。。。?
frogex
2018-12-28 15:57:21 +08:00
@cxbanana 这些方法我试过,有些数据不是登录 cookie 就行了,要一个 x5sec 的校验才能获取,这个 x5sec 有效期半小时。
我试过了在 mitmdump.exe 下注入 html 代码,修改 navigator.languages,plugins,webdriver
然后在 sufei_data.index.js 替换了重点 2 个判断,现在的结果是,打开 chrome,手动大概率能过滑块,但自动好像还是一次都过不了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/511335

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX