V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
GTim
V2EX  ›  职场话题

最近 24 小时热门数据 TopN 算法有啥好的方案吗?

  •  
  •   GTim · 235 天前 · 1440 次点击
    这是一个创建于 235 天前的主题,其中的信息可能已经有所发展或是发生改变。
    今天去面试,面到了 TopN 问题,小弟我回答的挺溜的,但是面试官突然说 24 小时内 TopN 问题,我就迷茫了,无从下手。误差可以在 5 分钟内。

    想知道大家是怎么解决的。
    10 条回复    2021-02-26 07:49:02 +08:00
    mxT52CRuqR6o5
        1
    mxT52CRuqR6o5   235 天前
    好像只能硬算吧,所以没法做到实时
    sizhitu
        2
    sizhitu   235 天前 via iPhone   ❤️ 1
    5 分钟一个桶么
    GGGG430
        3
    GGGG430   235 天前 via iPhone
    redis 的 sorted set 行不
    zjbztianya
        4
    zjbztianya   235 天前
    slide window?
    GTim
        5
    GTim   235 天前
    @zjbztianya 对,就是他的变形
    xupefei
        6
    xupefei   235 天前 via iPhone
    二楼说的对,桶排序之后全局提取 top N 。
    suiterchik
        7
    suiterchik   235 天前
    也有实时的方案,Misra-Gries 算法,这个是流式的算法
    缺点是数据不够大 or 长尾不够显著的时候会有误差,但你都需要用这个算法了,数据量显然足够
    ahill
        8
    ahill   234 天前
    oldmanong
        10
    oldmanong   234 天前 via iPhone
    Flink 滑动窗口
    关于   ·   帮助文档   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3721 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 03:46 · PVG 11:46 · LAX 20:46 · JFK 23:46
    ♥ Do have faith in what you're doing.