不知道这个问题是属于爬虫问题还是属于服务器问题？想请教下，爬二级页面的问题

实际情况是这样的在爬取二级页面的时候，我在浏览器里面发现，每个二级页面都会请求 10 个接口

假如说，我现在不爬取这个二级页面，改为爬虫这个接口，去请求 3 个接口

那么是直接爬取二级页面对服务器压力大？还是直接去请求那三个接口对服务器压力会大一点？我不太懂原理这块，想了解一下

keepeye

2020-05-16 11:48:38 +08:00

@Colorful 如果你的数据要通过接口获取，那么你用 requests 请求二级页面也拿不到数据啊，你只能拿到一个 html 而已，就产生了一次请求，可能还是 cdn 的，对服务器来说肯定是这种情况压力小啊

2bNot2b

2020-05-16 11:50:53 +08:00

@Colorful 如果是用 webdriver 之类的爬取的话，相当于是打开页面，页面多次请求接口（这个是请求数最多的）；如果使用 requests 之类的直接 get 二级页面的话，就只有一次请求；如果你直接用 requests 请求接口也是只有一次请求

imn1

2020-05-16 12:15:41 +08:00

肯定应该请求接口，除非你不知道接口的 url （变化的 url ），要从页面解析出来
单纯获取页面得不到数据，还要继续获取接口

但你的问题是问哪个压力大，那就答案相反

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.