如何集中管理 200 台云服务器

2023-07-14 13:30:32 +08:00
 Gtristan

搜罗的帖子说用 k8s 目前还没搭建 k8s ,有其它的铁子说说,你们都是怎么管理多台云服务器( Centos+Ubuntu )的吗 主要实现基本功能如下

  1. 能看服务器在线状态(尽量多显示 cpu 内存等信息那更好)
  2. 服务器离线提醒
  3. 其它系统信息

有这样的开源平台吗

2441 次点击
所在节点    问与答
21 条回复
cuixiao603
2023-07-14 13:40:20 +08:00
Prometheus
Aliencn
2023-07-14 13:40:49 +08:00
这个需求只需要一个监控就能实现吧。zabbix 或 prometheus
GeorgeWai
2023-07-14 13:51:43 +08:00
先拿出一台机器,然后把公钥丢给下面 200 台机器。然后基于 ssh 可以愉快的玩了,想看啥,就发命令,坐等返回,返回结果里会告诉你哪些机器超时了,5 分钟跑一次即可。
ropon
2023-07-14 13:54:27 +08:00
jumpserver 统一管理
prometheus 监控
ropon
2023-07-14 13:55:15 +08:00
@ropon prometheus+node_exporter 监控
b7cn
2023-07-14 14:14:08 +08:00
有个 iis7 的服务器管理工具
Gtristan
2023-07-14 14:28:17 +08:00
CaCo6
2023-07-14 15:53:59 +08:00
随便整个探针不就行了?
graetdk
2023-07-14 15:55:33 +08:00
哈哈,我想起我当年管理一堆服务器的艰难经历了。不过,如今的技术真是越来越发达了,管理云服务器也变得更加容易。建议可以考虑采用一些云平台的管理工具,或者使用自动化部署等技术,来轻松应对这个数量级的服务器管理工作。祝你好运!
bytesfold
2023-07-14 16:51:38 +08:00
说随便整整的一定没有大批量机器😅;

机器规模一旦起来了管理非常困难,不过基础的开源工具无论如何都是要用的,例如:Ansible 、Prometheus 、ELK
vast0906
2023-07-14 17:28:16 +08:00
Ansible / SaltStack (批量执行工具) + Prometheus (监控) + Grafana (展示)
flexbug
2023-07-14 18:27:48 +08:00
监控用 prometheus ,grafana ,alertmanager 管理的话 saltstack ,puppet ,ansible ,jump server 也行
deorth
2023-07-14 18:47:44 +08:00
招个好点的运维
LCD
2023-07-14 21:34:47 +08:00
jumpserver 简单够用,但不知道为什么批量执行脚本的图标转很久。。。,不知道是否 bug
LCD
2023-07-14 21:37:56 +08:00
另外 fabric 也是不错,几行就可以跑起来,只是开始接触的时候坑太多了
Illusionary
2023-07-14 21:45:31 +08:00
你都说云服务器了,还需要你搞这些这么基础的监控? 云厂商本来就有,你只要稍微配置一下告警指标和告警渠道就好了
me1onsoda
2023-07-14 21:49:32 +08:00
就这么简单的需求,云厂商的控制台不就能满足
wuzhewuyou
2023-07-15 02:54:19 +08:00
蹲个结果,暂时想到写一个 mqtt ,各服务器向总服务台发送状态信息,很容易做到离线提醒,支持一些远程指令等
nomytwins
2023-07-15 10:37:36 +08:00
我们用的 appnode
Subfire
2023-07-17 20:07:30 +08:00
Proxmox VE

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/956737

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX