V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
qoras
V2EX  ›  Java

请教, 多个抓取请求只等待其中一个, 其它阻塞要怎么实现呢

  •  
  •   qoras · 2017-05-04 00:43:01 +08:00 · 2195 次点击
    这是一个创建于 2792 天前的主题,其中的信息可能已经有所发展或是发生改变。
    现在有这样一个场景, 就是说要去抓取数据, 但是由于一些限制, 抓取次数不能太多
    所以当有多个相同的请求进来的时候, 希望能像 guava cache 那样, 只有其中一个去 load, 剩下的全部阻塞等待就可以了

    请求打到单机的话比较容易, 映射到本地的同一个 CountDownLatch 就可以
    多个机器的话, 想过用 redis 做分布式锁, 当有一个线程在抓的时候就加锁, 其它线程阻塞等待锁, 使用短时间睡眠+轮询来等待, 但感觉这个方案好像太挫了...

    想要实现的东西类似一个分布式 CountDownLatch, 看了 redis 的 api, 没有想到特别好的方式
    看了下 CountDownLatch 的实现, 好像也是类似轮询的东西

    大佬们, 有没有优雅一点的, 性能好一点的方案呢
    2 条回复    2017-05-04 09:39:44 +08:00
    hand515
        1
    hand515  
       2017-05-04 08:23:42 +08:00   ❤️ 1
    如果请求不需要同步返回的话,扔到消息队列处理就好了。简单点就用 redis 可以实现。
    消费进程用 BLPOP/BRPOP 进行阻塞等待。
    需要同步返回的话,阻塞等待的时候,通过 pub/sub 订阅也可以实现不用轮询
    troycheng
        2
    troycheng  
       2017-05-04 09:39:44 +08:00   ❤️ 1
    可以考虑队列,生产者消费者的方式,将要抓取的 url 扔进队列(可以多队列,也可以单队列里去重),抓取的事情交给消费者做。具体实现,简单处理的话,同楼上,redis 订阅发布机制就可以搞。

    多阶段协同性质的任务很多时候不需要用锁的机制,合理解耦任务,用队列的方式进行异步处理,是非常高效且容易实现的方式
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3027 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 13:46 · PVG 21:46 · LAX 05:46 · JFK 08:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.