有什么自动分析线上问题 规律/原因的系统么?

2019-07-17 10:53:27 +08:00
 gkiwi

先说背景:

公司线上系统,有个异常打点,数据目前存储在 ES 中,打点参数维度很多(有效的影响因素可能有 10 条左右),量级在每天几千到上万级别。

当线上异常数量波动较大的时候,每次都要人肉去分析下报错原因。比如某个用户短时间内激增报错,某个前端小版本在某次后端后端更新后报错变多。目前这些维度都是人肉基于经验,猜测根源,做关联对比之后,挨个排查,耗时耗力。

所以是否有些工具,可以自动挖掘引发波动的规律,做一些简单判断,然后以图表的形式展现?这样子会节省不少人力。

关于 ES 配套,有了解到 Kibana,看过简单的文档,似乎不满足"自动挖掘"这个点。

721 次点击
所在节点    问与答
2 条回复
ted2011
2019-07-17 13:06:23 +08:00
`自动`是个什么意思,别告诉我自动就是自动的意思啊,自动的意思想明白了,大概问题也就有解决方案了。
gkiwi
2019-07-18 01:18:34 +08:00
@ted2011 #1 确实如此。

其实并非不可描述。同一维度对比,两个维度交叉关联对比,只是想看看有没有这方面的工具,可以挖掘的更深,探索更多。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/583703

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX