Linux 多主机监控方案

2023-10-16 11:19:21 +08:00
 Lunrry

本人刚入职运维不久,现在公司内部有几十台服务器,同时不同客户单位也平均每家有两三台服务器需要运维管理。想要寻求一个方案,能够实时监控每台服务器的健康状态,我公司部署的服务健康状态,发生异常能够及时报警通知。目前想到的是利用 zabbix 进行监控,还请各位指点一下。

2362 次点击
所在节点    服务器
26 条回复
jstony
2023-10-16 11:31:43 +08:00
公司之前没有服务器监控?先问问前任怎么管理这些机器的。
zhhmax
2023-10-16 11:34:15 +08:00
prometheus+grafana ,也挺好用的,我自己的几台服务器就用的这个.
Lunrry
2023-10-16 11:34:35 +08:00
@jstony #1 以前的运维溜了,我是来接盘的,就我一个运维,我在 SVN 里面没看到有啥监控方案,感觉应该是手搓的
libook
2023-10-16 11:35:43 +08:00
先看是不是服务器上有现有的满足需要的监控方案,如果没有再考虑加监控。

在满足监控需求的基础上,哪个顺手就用哪个,比如你对 zabbix 熟悉就用 zabbix ,如果对 prometheus 熟悉就用 prometheus 。
Lunrry
2023-10-16 11:35:58 +08:00
@zhhmax #2 我去了解下,可以适应这种不同网络环境下的情况吗
greenskinmonster
2023-10-16 11:37:25 +08:00
zabbix 没啥问题,很好用
Lunrry
2023-10-16 11:41:09 +08:00
@libook #4 zabbix 会简单的安装配置,prometheus 完全没接触过,哪种方案入门容易呢
libook
2023-10-16 11:46:10 +08:00
@Lunrry #7 没有更容易的,都是在满足需求的基础上先入为主。比如你 zabbix 熟悉一些,相比来说可能就比 prometheus 少一些学习成本。
Lunrry
2023-10-16 11:50:53 +08:00
@libook #8 我觉得主要的难点是服务器位于不同地区,有的客户服务器没有公网 IP ,通过堡垒机连上的
libook
2023-10-16 12:07:27 +08:00
@Lunrry #9 多个网络的情况,比较理想的做法是做专用的通道来将监控数据集中收集。比如数据从每个网络以加密的方式推送到中心监控服务器。

你可以看看 Zabbix 的官方文档,看是否可以在每个网络内使用 Zabbix Proxy 来收集网络内的监控信息,然后再让 Zabbix Proxy 主动推送信息到网络外的中心 Zabbix 服务器。
internelp
2023-10-16 12:08:34 +08:00
@Lunrry zabbix 可以拉可推,配置推数据就可以了。
Lunrry
2023-10-16 13:15:51 +08:00
@libook #10 好的 多谢了,我去研究研究
Martin123123
2023-10-16 15:31:47 +08:00
还可以尝试类似于 哪吒监控 的方式,顺便可以做一下探针
Aumujun
2023-10-16 15:34:06 +08:00
单纯只是主机监控的话 推荐 zabbix ,有上 k8s ,可以 prometheus ,生态比较好。
tool2d
2023-10-16 15:34:41 +08:00
写点脚本,写个循环 ping ,ping 每一个服务器。

ping 不通超过几次就邮件报警。
Lunrry
2023-10-16 15:48:59 +08:00
@tool2d #15 这个只能监控服务器是否在线吧,而且别人单位的服务器有的在内网,有的禁止 ping
Foxkeh
2023-10-16 16:07:20 +08:00
十几台机器, 我是用的 zabbix, 告警是 Email+企业微信机器人
楼上说的 prometheus+grafana 方案听过好多次了, 等有空我也打算学习下
kumago
2023-10-16 16:27:07 +08:00
Uptime Kuma 简单
lifekevin
2023-10-16 16:51:32 +08:00
我现在用的方式是 prometheus+grafana ,不在同个网络的内网机器使用 vpn 通道来传输数据。
vpn 通道是用 wireguard 部署的,只要有一端有公网 IP 就可以了。
部署之前啥方案都不熟,所以选了当下比较多人推荐的方案,自己看文档慢慢测试就行。
bohai
2023-10-16 20:07:53 +08:00
建议 op 直接选用熟悉的 zabbix 来监控,不同地区使用 proxy 来完成数据采集。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/982357

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX