遇到一个数据统计的问题,求帮忙

2021-09-28 18:18:30 +08:00
 wshhfy
需求是这样的,有一张表(如下,均为模拟数据),数据量百万+,按照时间排列,如何才能得出大部分用户有效开关( true or false ),数据都在一张表中。

!可变参数为用户基数

一、如果是统计所有用户:当第 7 条数据进入时,获取到 true 的结果,因为 id(3 、6 、7)都为 true 。
二、如果是统计 2 位用户:
  1. 第 4 条数据进入时,为 false,因为 id(2 、4)。
  2. 第 5 条依旧 false 不变。
  3. 第 6 条为 true,因为 id(3 、6)。
  4. 第 7 条为 true 不变。
在程序中实时数据进来好判断,但是存量数据该如何筛选呢。用 SQL 实现应该是最好的吧,但是写不来,通过程序的话也没个好的思路。希望大佬们给点意见,谢谢!
ID 用户 开关 创建时间
1 A true 2021-01-01 20:00:00
2 B false 2021-01-01 20:01:00
3 A true 2021-01-01 20:02:00
4 C false 2021-01-01 20:03:00
5 B false 2021-01-01 20:04:00
6 C true 2021-01-01 20:05:00
7 B true 2021-01-01 20:06:00
471 次点击
所在节点    问与答
1 条回复
wshhfy
2021-09-29 11:34:31 +08:00
大佬们给点思路吧😂

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/804972

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX