[请教] 有木有大佬用 StarRocks 做过用户路径分析的哇

46 天前
pppwww  pppwww

rt,小弟目前要做一个基于 starRocks 的路径分析功能,参考火山引擎/神策数据,但是这两个平台没有展示 sql ,小弟感觉有点难以下手。

目前的思路是: 1 、首先要做到会话识别,通过窗口函数等操作将数据划分为一个个的会话 2 、从这个会话上识别出路径,然后 group by 统计信息等

上面的思路目前还是很模糊,有木有搞过的大佬分享下经验,万分感谢

621 次点击
所在节点   Starbucks  Starbucks
7 条回复
pppwww
pppwww
46 天前
手抖点错了,删掉删掉
Jim2Chen
Jim2Chen
45 天前
有思路了没?学习一下
pppwww
pppwww
44 天前
@Jim2Chen 用 4 层窗口函数实现了一个版本,但是查询性能感觉不是很好.. 4 个行为,13E 数据要 30s
Jim2Chen
Jim2Chen
43 天前
@pppwww 能发一下吗?参考一下
pppwww
pppwww
41 天前
@Jim2Chen 有空了写个文章分享下,目前整理的方案和公司的数据结合的比较多,不方便直接发,主要步骤就是:
1 、如何识别会话
通过窗口函数,计算相邻两次行为的时间间隔,按照规定的 sessionPeriod 切割会话
2 、识别会话后,如何实现路径的裁剪
通过窗口函数,找到路径的起始或者结束节点,然后进行一次裁剪
再次通过窗口函数,对每个会话的行为节点编号,进行一次深度上的裁剪
3 、最终返回给展示层的数据格式
这里有两种返回形式,一种是直接返回路径,然后业务层做计算,另一种是返回节点对之间的统计信息。可以根据业务需求自由选择
superliy
superliy
26 天前
StarRocks 好用吗
pppwww
pppwww
3 天前
@superliy 我们这里是有专门的团队来维护开发,同类型的用的比较少,pg/ck 等只是简单的用过几次,没法给出对比

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1110726

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX