请教一个 Python requests 获取淘宝链接跳转后的真实地址的实现方法

2017-06-07 23:43:13 +08:00
 nan0kai

链接地址如

https://s.click.taobao.com/WRoeUkw 

跳转成功的 URL 是

https://item.taobao.com/item.htm?id=548674077854&ali_trackid=2:mm_16389311_20848374_70766594:1496849954_2k8_1774242087&pvid=19_183.204.96.103_711_1495772079051

请问,如果用 requests 或者是 pyspider 得到后面的地址,最好有分析思路.

学习爬虫小白,感谢指导。

3225 次点击
所在节点    Python
3 条回复
misaka19000
2017-06-07 23:52:43 +08:00


做了几次重定向而已,检测到状态码是 302 就把 location 参数提取出来作为新的请求链接
wanglaihuai
2017-06-08 01:21:51 +08:00
requests.get(url).url 就是跳转的地址了。
linkiosk
2017-06-08 07:09:01 +08:00
二楼正解

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/366798

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX