有人做过模拟淘宝登录吗?

2018-09-12 09:31:48 +08:00
 caibou

有人做过模拟淘宝登录吗?最近想模拟登录淘宝联盟, 抓取订单信息,但是一直卡在登录这块。

我用 selenium + chromedriver 模拟登录操作, 但是每次都会显示验证码滑块, 模拟滑块滑过去的操作,就一直提示错误,要我刷新。一直卡在这个步骤。即便我用鼠标自己去操作滑块,也仍然会提示我出现错误,要我刷新。

但是如果我用浏览器正常打开,是不会有滑块出现的。

我觉得是 selenium + chromedriver 一开始进入网页就被识别成爬虫了。

有没有大佬有解决方案

10985 次点击
所在节点    Python
34 条回复
murmur
2018-09-12 09:43:00 +08:00
这个知乎上有讨论
从爆栈网上其他人的答案来看 淘宝的却会检查自动化防范
比如识别$cdc_asdjflasutopfhvcZLmcfl_、webdriver 这些关键字
参考 https://stackoverflow.com/questions/33225947/can-a-website-detect-when-you-are-using-selenium-with-chromedriver
这个 cdc 我以为是个乱码 看上去就是这么检测的
bmos
2018-09-12 09:46:53 +08:00
上次看到一个帖子,网站也是用了 webdriver 关键字屏蔽,好像需要自己修改后再编译才能去除。
golmic
2018-09-12 09:48:59 +08:00
提供基于 http/s 请求的淘宝、天猫、支付宝登录方案,requests 实现,可用于生产环境
kimqcn
2018-09-12 09:51:48 +08:00
笨,登陆的时候用 Autoit 啊,进去了再用 selenium.
xyfan
2018-09-12 09:52:36 +08:00
别说模拟登陆,我正常登陆都登陆不上去,过不去滑块验证,不知道怎么就把我识别为机器人了。
caibou
2018-09-12 10:06:07 +08:00
@xyfan 正常登录可以呀, 我正常打开 chrome 一切正常。
imn1
2018-09-12 10:08:44 +08:00
@xyfan +1
me2,虚拟机 ie 进不去,但 host(linux) chromium 则可以
qwertty01
2018-09-12 10:23:37 +08:00
@kimqcn 既然登录可以检测,你使用 selenium 一样可以检测,治标不治本。
xyfan
2018-09-12 11:02:54 +08:00
@caibou 肯定大部分人都可以正常登录,但是我手动都登录不上去,淘宝的验证方法肯定是有些问题。
dcatfly
2018-09-12 12:47:51 +08:00
改一下浏览器头?不太确定这个原理。另外推荐 Puppeteer。
beforeuwait
2018-09-12 13:40:41 +08:00
4 楼靠谱
slenium 一进去就被识别为爬虫了,过不了的。
shapl
2018-09-12 14:16:17 +08:00
直接调订单接口就是了。。。百度搜一下 taobao.tbk.sc.order.get
caibou
2018-09-12 14:35:50 +08:00
@shapl 这个要拥有高级权限才可以调用, 行不通的
nilrust
2018-09-12 14:40:31 +08:00
反正最简单的浏览器油猴脚本完全可以解决需求。
shapl
2018-09-12 14:42:21 +08:00
@caibou #13 搜一下再说。
caibou
2018-09-12 15:10:17 +08:00
@shapl 兄弟有什么直说呀, 官方这个 api 是要有高级权限才提供的
sujin190
2018-09-12 15:20:40 +08:00
而且以前似乎登录一次,你只要一直刷新,接近于使用,几乎不会掉出去,但是现在似乎有事没事踢出去,过几分钟就得重新登录一次,烦人的很
realkenshinji
2018-09-12 15:30:54 +08:00
除了这个,我记得以前还要你从下面的图片里选出你曾经购买过的物品....
jccg90
2018-09-12 15:31:11 +08:00
之前做过,登录部分要手动过验证,自动化总是出问题。。。然后加个微信告警通知,需要登录的时候提醒我连上去登录一下。。。
caibou
2018-09-12 16:12:40 +08:00
@sujin190
@realkenshinji
@jccg90
我目前在淘宝联盟的订单抓取, 但是 50 分钟登录状态就过期了。 不知道有没有什么好方法。
手动扫码登录肯定是不行的, 不可能人工 24 小时都在扫

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/488406

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX