V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
rayingecho
V2EX  ›  分享创造

做了个很功利的开源项目(延续之前的 aliyun-exporter), 提供一键搭建针对阿里云的监控告警

  •  
  •   rayingecho ·
    aylei · 2019-01-24 21:38:26 +08:00 · 4076 次点击
    这是一个创建于 2162 天前的主题,其中的信息可能已经有所发展或是发生改变。

    一个多前在 v2 发了[分享]阿里云的 Prometheus Exporter这个项目的第一版. 之后陆续有一些反馈, 其中有不少反馈表示对 Prometheus + Alertmanager + Grafana 这一套不熟悉, 以为拉起 exporter 之后所有监控和看板就都有了.

    于是当时就考虑那就写一个 docker-compose 帮助需要搭建监控告警系统的用户一键完成整套技术栈的部署好了. 磨磨蹭蹭一直拖到了今天晚上才一口气搞完. 主要是这个活确实比较脏, 没有啥乐趣, 因此目标也很明确了, 就是单纯来舔一波用户, 攒 star 和人气(不过也不知会不会有人需要呢...)

    正式介绍下功能, 开箱即用的版本中包含了针对阿里云的看板, 诊断, 告警(钉钉通知)功能, docker-compose 会拉起 prometheus, alertmanager, grafana 以及 aliyun-exporter. 因此在这套基础上扩展自有 IDC 的监控和应用监控也很简单. 整体的感觉如下:

    gif

    就是这样了, 项目地址: github

    4 条回复    2019-01-25 11:12:10 +08:00
    Jven
        1
    Jven  
       2019-01-25 00:29:46 +08:00 via Android
    你难道不觉得 alert 规则才是最重要的吗,一般没人盯着面板看的
    yylucifer
        2
    yylucifer  
       2019-01-25 10:49:56 +08:00
    alertmanager 我不喜欢,太技术化了,用户不友好。
    有两个东西我觉得很重要:
    - grafana 一键视图。
    - 简单傻瓜的 alerting rule。
    rayingecho
        3
    rayingecho  
    OP
       2019-01-25 11:07:50 +08:00
    @Jven
    警报规则没有比较好的开源项目可以解决, 就用 prometheus 自己的解决方案了
    rayingecho
        4
    rayingecho  
    OP
       2019-01-25 11:12:10 +08:00
    @yylucifer
    是的, Prometheus +Alertmanager 这套警报偏向给运维用, 用户的学习成本挺高的, 基本难以自助式
    Grafana 本身的警报模块足够傻瓜, 可惜功能太弱了, 一条规则无法追踪多条警报状态是个硬伤

    一键视图不知道指什么, 能说明下吗?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2920 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 14:42 · PVG 22:42 · LAX 06:42 · JFK 09:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.