使用框架(scrapy pyspider)有什么好处。感觉和自己手写脚本区别也不大,框架的主要优点是开发快吗?有没有哪些一般人不太会注意,但又重要的地方。
我希望在「不影响」其他用户的程度上尽可能的快,如果以 alexa 排名作为参考的话,一般来说并发数(下载速度)设置在什么程度比较好。
如何保证清洗完毕后的数据是正确的。现在我是先导入到别的数据库亲眼看一遍,之后才会导入主数据库。但其实也就看了一两页就不管了,有点拼运气的成分包含在内。有没有更专业点的办法
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.