为什么诸位老哥的爬虫的都是自己写的，不用 scrapy 呢？

2019-09-18 08:23:23 +08:00

wellhome

我研究了半天 scrapy 发现搞的太复杂了。除非大规模的爬，一般爬个几个站不若自己写的方便。不知是不是我打开 scrapy 的方式有问题。我看到大家都在推崇 scrapy。

5465 次点击

所在节点

26 条回复

chengxiao

2019-09-18 10:52:01 +08:00

小规模用 scrapy 才快吧......几句业务就 ok 了

BooksE

2019-09-18 10:59:09 +08:00

我十几个站都用 scrapy 爬的。。scrapy 很好用

WuMingyu

2019-09-18 11:07:50 +08:00

可以写个 scrapy 的模版，用的时候 copy 下，再改改一些业务代码

ClericPy

2019-09-18 11:22:35 +08:00

自己的 async await, 为什么要折腾 twisted, 后者作者倒是挺厉害... 能把 guido 老爹气出门去

2019-09-18 12:15:06 +08:00

小折腾用 requests + pyquery 梭哈

niknik

2019-09-18 17:11:26 +08:00

emmm，就我目前的站点数据，都用不上 scrapy。。。。直接脚本了

第 2 页／共 2 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.