问个问题,要把淘宝 支付宝的登陆 完全用 requests urllib 写出来,需要多强的前端和爬虫水平

2017-09-19 11:20:31 +08:00
 zgbgx1

我是从 java web 转到爬虫和数据的,以前,也要自己写前端,但是看到阿里的这些前端的各种各样的东西,有些实在找不到请求发出的文件,找不到具体哪个请求可能设置了 cookie 或 session,还有很多前端加密的东西 也不是很熟

8270 次点击
所在节点    Python
34 条回复
huanglongtiankon
2017-09-20 08:41:16 +08:00
想要纯技术突破还是别想了,最现实的解决方案是手工登录后拿到 cookies,然后再爬
zgbgx1
2017-09-20 08:51:08 +08:00
@huanglongtiankon webdriver 登陆,拿到 cookies,然后再爬的已经做了,还有内置浏览器拿 cookies 的方案
Ehco1996
2017-09-20 09:06:42 +08:00
@zgbgx1

我也用 webdirver 拿 cookie 试过

就算你随机访问,定时刷新
三个小时之内还是会死
loveCoding
2017-09-20 10:04:04 +08:00
淘宝的反爬虫不是开玩笑
levon
2017-09-20 10:07:47 +08:00
如果是去爬淘宝的网页,即使登录实现了,也意义不大。反爬虫机制级别很高。
jccg90
2017-09-20 12:41:04 +08:00
成本很高,因为要登录,所以要找一堆账号来测试,失败了账号就被标记了,整天就各种验证。。。只能换账号
m939594960
2017-09-20 13:19:45 +08:00
@FanWall #18 别想得这么难,这么贵。实际上私下多少人流通这套技术你也不知道。。而且算法不可能变动的那么频繁的,一年变一回就不错了
ioriwong
2017-09-20 15:02:46 +08:00
我做过虚拟机自动取得 Cookies 的方案
googlebot
2017-09-20 15:53:53 +08:00
跟马云的余额宝都,需要勇气,
sarices
2017-09-20 16:44:31 +08:00
淘宝打开链接快一点都提示输入验证码,特别是各种电子票,旅游子类的。
sola97
2017-09-20 16:50:51 +08:00
不敢想
a234712524
2017-09-29 14:00:49 +08:00
@hu0097 请问你的联系方式多少,我有点事情想向你咨询
HANlalala
2018-10-12 21:06:08 +08:00
@Luckyray 是不是没有 ua 就不能登录啊
HANlalala
2018-10-12 21:06:51 +08:00
@zgbgx1 用已有的账号密码要怎么用 php 爬虫进行登录呀

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/391909

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX