如何用 pandas 计算不同群组的留存率?

2018-06-12 10:31:14 +08:00
 UN2758

勉强会计算同一群组下的留存率,但是有了 groupid 之后就不知道如何处理了.
这是简单的留存率

这是数据

我最开始的想法是按 gid 分表然后把时间重采样到天,然后按天合并相同天的记录,求注册用户和登录用户之间的交集,但是 pandas 似乎这样做不了?
对于最后得到的留存率表的格式我也不是很清楚,希望是按[gid][date]查询这样的?

1141 次点击
所在节点    问与答
2 条回复
funky
2018-06-12 10:32:57 +08:00
redis bitmap 了解一下?
UN2758
2018-06-12 11:00:37 +08:00
@funky #1 最后是会使用 dask 做分布式计算,dask 继承实现了 pandas 的一些类

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/462371

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX