scrapy 抓取网站报错,本地抓取没问题,部署到服务器上就报错

2016-10-29 13:38:41 +08:00
 chendajun
File "/usr/local/python3/lib/python3.5/site-packages/scrapy/core/downloader/middleware.py", line 43, in process_request
defer.returnValue((yield download_func(request=request,spider=spider)))
twisted.web._newclient.ResponseNeverReceived: [<twisted.python.failure.Failure OpenSSL.SSL.Error: [('SSL routines', 'SSL23_READ', 'ssl handshake failure')]>]
2016-10-29 13:31:29 [scrapy] INFO: Closing spider (finished)
2016-10-29 13:31:29 [scrapy] INFO: Dumping Scrapy stats:
{'downloader/exception_count': 6,
'downloader/exception_type_count/twisted.web._newclient.ResponseNeverReceived': 6,
'downloader/request_bytes': 1824,
'downloader/request_count': 6,
'downloader/request_method_count/GET': 6,
'finish_reason': 'finished',
'finish_time': datetime.datetime(2016, 10, 29, 5, 31, 29, 645084),
'ip': None,
'log_count/DEBUG': 7,
'log_count/ERROR': 2,
'log_count/INFO': 24,
'open_time': '2016-10-29 13:28:28',
'post_item': 0,
'scheduler/dequeued/redis': 3,
'scheduler/enqueued/redis': 3,
'site': 'YouTube',
'start_time': datetime.datetime(2016, 10, 29, 5, 28, 28, 85879)}
2016-10-29 13:31:29 [scrapy] INFO: Spider closed (finished)
4733 次点击
所在节点    Python
6 条回复
knightdf
2016-10-29 15:13:00 +08:00
twisted.web._newclient.ResponseNeverReceived, 你服务器上可以访问 youtube?
chendajun
2016-10-29 15:33:58 +08:00
@knightdf 可以的,服务器在香港。现在时不时的可以抓取。就是不稳定。
loalj
2016-10-29 15:39:56 +08:00
chendajun
2016-10-29 15:42:56 +08:00
@loalj 怎么解决呢?
loalj
2016-10-29 21:05:07 +08:00
@chendajun 链接里边不是有解决方案么,仔细看啊。
chendajun
2016-10-29 21:28:00 +08:00
@loalj 看了,没有解决问题

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/316406

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX