关于并发爬虫的问题

2018-09-03 19:06:36 +08:00
 hobbyliu

最近写了一个小爬虫,设置 200 进程。 不知道为啥经常出现

cURL error 28: Resolving timed out after 2511 milliseconds (see http://curl.haxx.se/libcurl/c/libcurl-errors.html) 而且概率很大。 我服务器 内存 cup 足够,带宽测速 speedtest-cli 下行 100M 上行 10M。

怀疑是 dns 但是跟换后依旧不行。

求大神指教。

1332 次点击
所在节点    问与答
2 条回复
dengtongcai
2018-09-04 00:04:31 +08:00
对方带宽不够?
hobbyliu
2018-09-04 10:20:39 +08:00
@dengtongcai 不应该啊,据说这网站能同时在线 300 万人,而且本地单个进程当时能请求成功
查了下说是 dns 问题,打算绑定于强制 对方 ip 域名试试。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/485753

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX