爬虫根据 start_urls 去爬页面,然后对返回的结果处理,如果有 10 个 start_urls ,他是 10 个网址同时去访问,获得结果,然后 10 个同时处理吗, 10 个线程再各自处理自己的结果里的信息吗
感觉如果是一个线程的话,那难道是一个一个的访问,然后等完全处理掉了其中一个 start_urls 以及其后续结果里的内容,才会去处理第二个 start_urls 吗
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.