scrapy 的速度真的很不给力呀?

2017-05-21 18:06:34 +08:00
 xiaoyu9527

我抓一个妹子图。 最大带宽只能跑到 3M。

感觉并发还是有点少。 能不能加到 50 个并发。

不是异步的么?

2116 次点击
所在节点    Python
3 条回复
dsg001
2017-05-21 18:38:39 +08:00
```python
# Configure maximum concurrent requests performed by Scrapy (default: 16)
# CONCURRENT_REQUESTS = 32
```
可以修改配置,但采集的瓶颈从来都不是并发,如果图片下载建议采集网址,之后调用 wget 下载,速度更好
chendajun
2017-05-21 20:24:36 +08:00
个人建议:先把 Scrapy 吃透再说性能问题
xiaoyu9527
2017-05-21 22:31:40 +08:00
@dsg001 我修改了感觉好像是腾讯云的性能的太渣。 并不是 scrapy 的锅。

因为我国外抓国外开到 32 线程可以跑 100M

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/362798

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX