V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
oukichi
V2EX  ›  问与答

萌新发问:那些 B 站小红书的大数据分析工具,数据是怎么采集的?

  •  
  •   oukichi · Jun 25, 2024 · 1803 views
    This topic created in 673 days ago, the information mentioned may be changed or developed.

    网站截图.png ,懒得点连接的朋友直接看截图就好

    类似于这种网站,明显是把所有数据都爬了下来

    https://xz.newrank.cn/

    如果只是普通的爬虫的话,上千万个页面岂不是要爬到死? 还是说他们是 N 台机器一起爬?

    我从没碰过爬虫,所以想在这里问一问,知道 V 站大神多,谢谢各位啦

    4 replies    2024-06-25 10:59:20 +08:00
    EsWann
        1
    EsWann  
       Jun 25, 2024   ❤️ 1
    都是集群爬虫啊
    Solix
        2
    Solix  
       Jun 25, 2024 via iPhone   ❤️ 1
    无头浏览器,虚拟机等等
    justfun
        3
    justfun  
       Jun 25, 2024
    爬虫会涉及到法律问题 听别人说是买的官方数据
    JustZzer
        4
    JustZzer  
       Jun 25, 2024
    爬虫做的,相对购买数据爬虫成本低,除了榜单和热销数据,其他的适当控制请求量级即可
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4247 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 48ms · UTC 05:21 · PVG 13:21 · LAX 22:21 · JFK 01:21
    ♥ Do have faith in what you're doing.