楼主现在想做一个大规模的爬虫爬取,寒假看了很多关于爬虫进阶的文章,文档,
归纳下来,寒假接触的爬虫爬取性能提升的模块和库:
那么除了这上面的还有别的么= =,另外这上面的哪些比较好使,哪些又一些坑呢?
关于任务队列,是不是都推荐使用 redis ? redis 构建分布式的爬取麻烦么?(正在看 redis 的书籍)
除了 redis 还有什么别的好使的办法么?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.