萌新发问:那些 B 站小红书的大数据分析工具,数据是怎么采集的?

156 天前
 oukichi

网站截图.png ,懒得点连接的朋友直接看截图就好

类似于这种网站,明显是把所有数据都爬了下来

https://xz.newrank.cn/

如果只是普通的爬虫的话,上千万个页面岂不是要爬到死? 还是说他们是 N 台机器一起爬?

我从没碰过爬虫,所以想在这里问一问,知道 V 站大神多,谢谢各位啦

1149 次点击
所在节点    问与答
4 条回复
EsWann
155 天前
都是集群爬虫啊
gaobh
155 天前
无头浏览器,虚拟机等等
justfun
155 天前
爬虫会涉及到法律问题 听别人说是买的官方数据
JustZzer
155 天前
爬虫做的,相对购买数据爬虫成本低,除了榜单和热销数据,其他的适当控制请求量级即可

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1052263

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX