求大神指点: urllib2.urlopen(url,timeout=10).read() 循环采集 如果一超时后报错 然后就停止运行了

2015-03-06 16:11:01 +08:00
 156007766

urllib2.urlopen(url,timeout=10).read() 循环采集 如果一超时后报错 然后就停止运行了

请问一下如果超时了还让程序继续运行下去!

Traceback (most recent call last):
File "E:\PYTHON EXAMPLE\robot.py", line 114, in <module>
runTask(work, day=0, hour=0, min=0, second=5)
File "E:\PYTHON EXAMPLE\robot.py", line 104, in runTask
func()
File "E:\PYTHON EXAMPLE\robot.py", line 55, in work
bk_browse = urllib2.urlopen(url,timeout=10).read()
File "C:\Python27\lib\urllib2.py", line 154, in urlopen
return opener.open(url, data, timeout)
File "C:\Python27\lib\urllib2.py", line 431, in open
response = self._open(req, data)
File "C:\Python27\lib\urllib2.py", line 449, in _open
'_open', req)
File "C:\Python27\lib\urllib2.py", line 409, in _call_chain
result = func(*args)
File "C:\Python27\lib\urllib2.py", line 1227, in http_open
return self.do_open(httplib.HTTPConnection, req)
File "C:\Python27\lib\urllib2.py", line 1200, in do_open
r = h.getresponse(buffering=True)
File "C:\Python27\lib\httplib.py", line 1074, in getresponse
response.begin()
File "C:\Python27\lib\httplib.py", line 415, in begin
version, status, reason = self._read_status()
File "C:\Python27\lib\httplib.py", line 371, in _read_status
line = self.fp.readline(_MAXLINE + 1)
File "C:\Python27\lib\socket.py", line 476, in readline
data = self._sock.recv(self._rbufsize)
error: [Errno 10054]

16604 次点击
所在节点    Python
11 条回复
aec4d
2015-03-06 16:19:50 +08:00
import requests
requests.packages.urllib3.disable_warnings = True
requests.get(url, timeout=10).text
156007766
2015-03-06 16:28:49 +08:00
@aec4d 谢谢!
xierch
2015-03-06 16:33:15 +08:00
try ... except ...
Sylv
2015-03-06 16:35:03 +08:00
import socket

try:
>>> urllib2.urlopen(url,timeout=10).read()
except socket.error:
>>> continue


PS: Errno 10054 并不是超时,而是连接被远端重置。
156007766
2015-03-06 16:47:24 +08:00
@Sylv
请问一下如果是被重置了 要怎么才能获取到重置后的地址呢
Sylv
2015-03-06 17:04:27 +08:00
@156007766 重置指的是:你请求太频繁了,超出人家服务器的限制了,然后远程服务器端就把你的连接强制关闭了。
解决办法是降低请求频率,或者用多个代理。
msg7086
2015-03-06 20:12:07 +08:00
@156007766 务必补一下网络相关知识
156007766
2015-03-06 21:19:46 +08:00
@Sylv
@msg7086
谢谢 楼上几位! timeout的问题已经解决了
现在是 error: [Errno 10054] 报错
但是我用浏览器 请求 一直刷新 都不会 出问题
而且我PY爬的 频率也不大 几秒钟一次吧
我用浏览器 同时开几个窗口PHP采集 好像还没出现过问题!
gamexg
2015-03-07 21:49:31 +08:00
伪装 headers 了吗?
program2000
2015-03-09 10:40:13 +08:00
要用try except拦截,不然这个错误解决了,下次还会有各种其他错误。。。。
156007766
2015-03-09 11:24:10 +08:00
@gamexg @program2000
谢谢已经 用try except 解决了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/174955

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX