咨询 python3 urllib,访问不了

2016-07-09 22:43:14 +08:00
 kingmo888

http://www.czce.com.cn/portal/exchange/2015/datadaily/20151111.htm

为何这个地址抓到的结果是

b'<html><head><title>Request Rejected</title></head><body>The requested URL was rejected. Please consult with your administrator.

Your support ID is: 13212746783469538584</body></html>'

构建了一个常规的 header

请教。。谢谢。

2353 次点击
所在节点    Python
4 条回复
linauror
2016-07-09 23:00:47 +08:00
设置 headers 即可,主要是 user_agent
okKO
2016-07-09 23:28:40 +08:00
Jblue
2016-07-10 10:03:04 +08:00
抓包分析一下
raycool
2016-07-10 16:02:18 +08:00
import requests

url='http://www.czce.com.cn/portal/exchange/2015/datadaily/20151111.htm'
header = {
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/601.5.17 (KHTML, like Gecko) Version/9.1 Safari/601.5.17'
}
r= requests.get(url,headers=header)
print r.text

我说网址这么顺眼,原来前东家。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/291425

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX