问个问题,要把淘宝 支付宝的登陆 完全用 requests urllib 写出来,需要多强的前端和爬虫水平

2017-09-19 11:20:31 +08:00
 zgbgx1

我是从 java web 转到爬虫和数据的,以前,也要自己写前端,但是看到阿里的这些前端的各种各样的东西,有些实在找不到请求发出的文件,找不到具体哪个请求可能设置了 cookie 或 session,还有很多前端加密的东西 也不是很熟

8270 次点击
所在节点    Python
34 条回复
hu0097
2017-09-19 13:01:07 +08:00
登录有加密的,刚入门搞不定的。用 selenium 吧
zgbgx1
2017-09-19 13:43:37 +08:00
@hu0097 不是刚入门,做过前后端开发
LukeChien
2017-09-19 14:12:36 +08:00
用 Chrome Headless
zgbgx1
2017-09-19 14:16:38 +08:00
@LukeChien 用 webdriver 就是另一种方式了
fy
2017-09-19 15:00:40 +08:00
需要 selenium/chrome headless
shingle
2017-09-19 18:14:58 +08:00
完全模拟是几乎不可能的,光`ua`参数的加密就够你受的了
102400
2017-09-19 19:24:48 +08:00
搞定这个登录不会少于 1k 的,建议放弃或者直接找人买
zzNucker
2017-09-19 19:29:51 +08:00
1k 你想多了
起码 w 起
Tink
2017-09-19 19:54:43 +08:00
@102400 你确定 1k ?
regicide
2017-09-19 20:10:45 +08:00
去逆向网易有财的 app 包看他们怎么实现的
neoblackcap
2017-09-19 20:12:51 +08:00
干爬支付宝的早死了,第频率的还可,高频率的,技术封了,触发风控系统,做爬虫很难解决的。
binux
2017-09-19 20:16:46 +08:00
用 requests 写个代理,然后把浏览器设置到你代理上,这算不算「完全用 requests urllib 写出来」?
fiht
2017-09-19 21:22:53 +08:00
无法量化
成本过高
不如用印度云手工登录生成 cookie
wuhau
2017-09-19 22:30:10 +08:00
taobao 用 selenium,抓 cookie2,之前做淘宝客搞过这玩意。淘宝就不清楚了。
ob
2017-09-19 23:13:53 +08:00
现在稍微登录情景有点不一样,就开始手机验证,地址验证,各种验证。。
LukeChien
2017-09-20 00:31:12 +08:00
起台虚拟机跑 Chrome Headless,可以搞
Luckyray
2017-09-20 00:53:29 +08:00
那个 ua 就卡死我了……
FanWall
2017-09-20 03:00:55 +08:00
来说一下~楼上 1w 也想多了,别说纯算法了,就是临时的解决方案也不是这个价格。
加密代码混淆且经常更新的,且都是业界顶级。
而且以支付宝的开发能力,我觉得这种前端加密在不远的未来就几乎无解:破了一个混淆?那我重新混淆下;破了混淆机制?那我换个混淆机制换个算法…
通用解决方案也许是对底层十分精通的人才能做到的吧。。写个专用的解释器出来?猜的。。。
daimao
2017-09-20 03:04:48 +08:00
你 xx 出多少, 我阿里出两倍(
jingniao
2017-09-20 08:40:34 +08:00
感觉不光是技术问题,淘宝支付宝现在动不动就手机验证之类的,风控麻烦

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/391909

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX