求推荐好用的服务器集群监控系统

2020-10-08 01:45:59 +08:00
 dangyuluo

最近我们的 CI 系统升级了一下,开始使用 AWS EC2 Autoscaling,放弃了 Kubernetes (顺带吐槽一下 AWS 永远不会去修他们的 CNI bug )。

目前我们在使用 AWS Cloudwatch 来检测 autoscaling group 的健康状况,但只有很简单的信息像 CPU 负载等。我们计划部署一套服务器集群监控,请大家推荐一下自己觉得好用的。

需要的功能:

  1. 节点可以部署在我们一台服务器上
  2. 可以主动或被动发现新的服务器节点
  3. 需要统计 CPU/内存 /硬盘等信息
  4. 需要能够统计自定义信息,比如某台机器上的 docker container 数量
  5. 需要支持历史记录,比如查询在某个某个时间段内记录的信息
  6. 最好有 Web 截面
  7. 可以付费
2069 次点击
所在节点    问与答
7 条回复
DearTanker
2020-10-08 03:28:54 +08:00
插眼标记,同样需要,不喜欢自建,倾向国外的收费服务,目前在用 hetrixtools.com
ladypxy
2020-10-08 06:04:59 +08:00
微软的 system manager
yongligua
2020-10-08 07:47:09 +08:00
zabbix
xabc
2020-10-08 12:41:50 +08:00
prometheus
Ephzent
2020-10-08 17:17:45 +08:00
prometheus + grafana
Aksura
2020-10-08 20:26:45 +08:00
ganglia
DoctorCat
2020-10-09 03:16:46 +08:00
规模不是很大(<千台)的情况下,zabbix 足够了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/712996

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX