V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
UN2758
V2EX  ›  问与答

如何用 pandas 计算不同群组的留存率?

  •  
  •   UN2758 · Jun 12, 2018 · 1452 views
    This topic created in 2889 days ago, the information mentioned may be changed or developed.

    勉强会计算同一群组下的留存率,但是有了 groupid 之后就不知道如何处理了.
    这是简单的留存率
    简单的留存率
    这是数据
    TIM20180612102312.png
    我最开始的想法是按 gid 分表然后把时间重采样到天,然后按天合并相同天的记录,求注册用户和登录用户之间的交集,但是 pandas 似乎这样做不了?
    对于最后得到的留存率表的格式我也不是很清楚,希望是按[gid][date]查询这样的?

    2 replies    2018-06-12 11:00:37 +08:00
    funky
        1
    funky  
       Jun 12, 2018
    redis bitmap 了解一下?
    UN2758
        2
    UN2758  
    OP
       Jun 12, 2018
    @funky #1 最后是会使用 dask 做分布式计算,dask 继承实现了 pandas 的一些类
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3005 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 07:15 · PVG 15:15 · LAX 00:15 · JFK 03:15
    ♥ Do have faith in what you're doing.