python requests 请求一个地址,获取不到跳转后的地址?求高手帮助

2015-04-27 17:04:57 +08:00
 yangguang31466

用python requests请求这个地址(http://www.tsdxb.com/links/80031)的时候,获取不到跳转后的url,要获取跳转后的url有什么好的办法吗?

14191 次点击
所在节点    问与答
11 条回复
yangguang31466
2015-04-27 17:06:14 +08:00
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36',
'Connection':'keep-alive',}
url1=requests.get(url,headers=headers,stream=True)
raw_url=url1.url
获取到的还是原来的地址
yangguang31466
2015-04-27 17:11:04 +08:00
没人回答!在线等!
binux
2015-04-27 17:14:05 +08:00
js 跳转
yangguang31466
2015-04-27 17:19:17 +08:00
浏览器禁用js也能跳转!
crazyxin1988
2015-04-27 17:22:06 +08:00
用fiddler看看就知道了
Septembers
2015-04-27 17:30:53 +08:00
yangguang31466
2015-04-27 17:31:56 +08:00
打开链接中间等待了几秒,这个链接才自动跳转!用requests请求最开始的地址,得到的总是一样的,获取不到跳转后的!
yangguang31466
2015-04-27 17:33:44 +08:00
从地址的内容中去找 是可以的,感谢!
yangtukun1412
2015-04-27 17:55:48 +08:00
因为不是用js做的跳转,是 head 里的 <meta http-equiv="Refresh" content="1;url=http://t.yhd.com/?tracker_u=1042102010" /> 做的跳转
fork3rt
2015-04-28 07:36:09 +08:00
r = requests.get('https://xxx.com', headers=headers, cookies=cookies, allow_redirects=False)

print r.headers['Location']

针对302
nodewee
2018-01-11 17:21:40 +08:00
时间到了今天,python 3.6 就简单多了
import requests
r = requests.get('http://xxx')
print(r.url)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/186735

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX