求助,关于时序数据异常检测

2023-06-16 13:57:59 +08:00
 Cola98

小弟最近接到一个新任务,调研 holoinsight-ai 算法服务,花了几天把里面一些概念搞清楚了,现在比较纠结的一个点是它提供了一个 JSON 数据:

{
    //历史数据
  "InputTimeSeries": {
    "1681710540000": 559, 
    "1681710600000": 597,
    "1681710660000": 505,
    "1681710720000": 572,
    "1681710780000": 515,
    "1681710840000": 552,
    "1681710900000": 549,
    "1681710960000": 521,
    "1681711020000": 500,
    "1681711080000": 564,
    "1681711140000": 517,
    "1681711200000": 5000
  },
    "intervalTime": 60000, //间隔 60000ms,InputTimeSeries 中每个时间相差 60000ms
    "detectTime": 1681711200000, //检测时间
    "algorithmConfig": {
    "algorithmType": "up", //关心上升还是下降趋势
    "sensitivity": "mid" //算法敏感度, 敏感度越高,算法对异常数据的检测越严格,可能会有更多的误报。敏感度越低,算法对异常数据的检测越宽松,可能会有更多的漏报。
  },
    "ruleConfig": { //规则配置
    "defaultDuration": 1, //持续告警时间,这里是 1 分钟。
    "customChangeRate": 0.1 //表示阈值为 10%。,两个值之间变化率差距超过 0.1 就会告警
  }
}

关于 InputTimeSeries 这一块,比较这一块应该放什么类型的数据,看美团的文章里面是分为了三种:周期型、平稳型和无规律波动型。

初步想法是先获取 K8S 相关资源的时序数据,然后做分类,在用异常注入的方法来验证这个算法服务,不知道可不可行?

836 次点击
所在节点    程序员
2 条回复
CoooooolFrog
2023-06-16 14:04:52 +08:00
可行,直接使用 Pod 的 CPU 、Mem 等水位数据应该就比较有可信度了
Cola98
2023-06-16 14:08:26 +08:00
@CoooooolFrog ok ,多谢大佬,主要是担心思路出问题

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/949289

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX