做了个很功利的开源项目(延续之前的 aliyun-exporter), 提供一键搭建针对阿里云的监控告警

2019-01-24 21:38:26 +08:00
 rayingecho

一个多前在 v2 发了[分享]阿里云的 Prometheus Exporter这个项目的第一版. 之后陆续有一些反馈, 其中有不少反馈表示对 Prometheus + Alertmanager + Grafana 这一套不熟悉, 以为拉起 exporter 之后所有监控和看板就都有了.

于是当时就考虑那就写一个 docker-compose 帮助需要搭建监控告警系统的用户一键完成整套技术栈的部署好了. 磨磨蹭蹭一直拖到了今天晚上才一口气搞完. 主要是这个活确实比较脏, 没有啥乐趣, 因此目标也很明确了, 就是单纯来舔一波用户, 攒 star 和人气(不过也不知会不会有人需要呢...)

正式介绍下功能, 开箱即用的版本中包含了针对阿里云的看板, 诊断, 告警(钉钉通知)功能, docker-compose 会拉起 prometheus, alertmanager, grafana 以及 aliyun-exporter. 因此在这套基础上扩展自有 IDC 的监控和应用监控也很简单. 整体的感觉如下:

就是这样了, 项目地址: github

4075 次点击
所在节点    分享创造
4 条回复
Jven
2019-01-25 00:29:46 +08:00
你难道不觉得 alert 规则才是最重要的吗,一般没人盯着面板看的
yylucifer
2019-01-25 10:49:56 +08:00
alertmanager 我不喜欢,太技术化了,用户不友好。
有两个东西我觉得很重要:
- grafana 一键视图。
- 简单傻瓜的 alerting rule。
rayingecho
2019-01-25 11:07:50 +08:00
@Jven
警报规则没有比较好的开源项目可以解决, 就用 prometheus 自己的解决方案了
rayingecho
2019-01-25 11:12:10 +08:00
@yylucifer
是的, Prometheus +Alertmanager 这套警报偏向给运维用, 用户的学习成本挺高的, 基本难以自助式
Grafana 本身的警报模块足够傻瓜, 可惜功能太弱了, 一条规则无法追踪多条警报状态是个硬伤

一键视图不知道指什么, 能说明下吗?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/530386

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX