系统监控方面有没有什么理论可以学习?

2020-07-28 17:13:25 +08:00
 CrazyMoon
背景:之前维护的系统快要下线了,为了不让楼主失业,领导让楼主学习系统监控,使用 Splunk 、Azure 等工具对其它的几个系统做监控。。简单试用了 Splunk,工具本身不难,但问题是自己对监控需求没有全面的想法,也不知道做什么事情会比较有价值。感觉是因为自己没有理论知识的错。

求各位 v 友推荐一些读物,帮偶增长知识...
1536 次点击
所在节点    问与答
5 条回复
CrazyMoon
2020-07-28 17:42:46 +08:00
求回复..
hyperdak288
2020-07-28 17:59:05 +08:00
可以看看 可观测性的概念以及相关项目。


关键词:apm,trace,metric,log,observability,可观测性
规范:open-tracing,open-metric
具体实现项目:skywalking,zipkin,pinpoint,prometheus,elastic stack,阿里鹰眼

书:《 google SRE 》

可观察性 文稿推荐: https://elasticsearch.cn/slides/232
CrazyMoon
2020-07-28 18:03:48 +08:00
@hyperdak288 看起来很好,感谢老哥~~
594duck
2020-07-31 15:15:39 +08:00
@hyperdak288 非常赞同。

同时楼主要从上往下学,即为什么要监控,监控的目标是什么

这涉及到 SLI,SLO,SLA 。有了这三个指标就知道怎么服务三个指标。
594duck
2020-07-31 15:15:48 +08:00
指标也在那本 SRE 书里了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/693808

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX