V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
dangyuluo
V2EX  ›  问与答

求推荐好用的服务器集群监控系统

  •  
  •   dangyuluo · 2020-10-08 01:45:59 +08:00 · 2100 次点击
    这是一个创建于 1536 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近我们的 CI 系统升级了一下,开始使用 AWS EC2 Autoscaling,放弃了 Kubernetes (顺带吐槽一下 AWS 永远不会去修他们的 CNI bug )。

    目前我们在使用 AWS Cloudwatch 来检测 autoscaling group 的健康状况,但只有很简单的信息像 CPU 负载等。我们计划部署一套服务器集群监控,请大家推荐一下自己觉得好用的。

    需要的功能:

    1. 节点可以部署在我们一台服务器上
    2. 可以主动或被动发现新的服务器节点
    3. 需要统计 CPU/内存 /硬盘等信息
    4. 需要能够统计自定义信息,比如某台机器上的 docker container 数量
    5. 需要支持历史记录,比如查询在某个某个时间段内记录的信息
    6. 最好有 Web 截面
    7. 可以付费
    7 条回复    2020-10-09 03:16:46 +08:00
    DearTanker
        1
    DearTanker  
       2020-10-08 03:28:54 +08:00
    插眼标记,同样需要,不喜欢自建,倾向国外的收费服务,目前在用 hetrixtools.com
    ladypxy
        2
    ladypxy  
       2020-10-08 06:04:59 +08:00 via iPhone
    微软的 system manager
    yongligua
        3
    yongligua  
       2020-10-08 07:47:09 +08:00
    zabbix
    xabc
        4
    xabc  
       2020-10-08 12:41:50 +08:00 via iPhone
    prometheus
    Ephzent
        5
    Ephzent  
       2020-10-08 17:17:45 +08:00
    prometheus + grafana
    Aksura
        6
    Aksura  
       2020-10-08 20:26:45 +08:00
    ganglia
    DoctorCat
        7
    DoctorCat  
       2020-10-09 03:16:46 +08:00
    规模不是很大(<千台)的情况下,zabbix 足够了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1664 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 16:25 · PVG 00:25 · LAX 08:25 · JFK 11:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.