关于服务器信息收集的一些小问题

2018-03-09 13:40:42 +08:00
 NaVient

目前有 100 台阿里云服务器的机器的信息需要监控 我的想法是使用 Python 获取到服务器的信息然后,在服务端通过 socket 获取. 但是因为服务器数量比较多的原因,不知道时效性能不能保证. 自己不是做运维的对这方面没什么经验,想请教各位大牛这种需求的最佳实践是什么?

3233 次点击
所在节点    程序员
11 条回复
Immortal
2018-03-09 13:47:54 +08:00
有成熟的开源监控方案 为啥要自己造轮子
我不是做运维的
yunlzheng
2018-03-09 13:51:14 +08:00
搭一套 Promethues,轻松搞定
nicolas0caser
2018-03-09 14:01:43 +08:00
如果是服务器基础设施监控无非以下几个指标:内存、cpu、磁盘(占用、IO )、网络 IO 等,无论是自己写 Python 脚本实现或者使用成熟的开源的软件都可以的。我司目前服务器 70 台左右,使用 telegraf+influxdb+grafana:telegraf 做 agent 收集服务器基础数据,发送到 influxdb,grafana 做前端展示,基本符合需求了。当然也存在单点故障的问题,再就是 influxdb 隔断时间会异常退出,有点蛋疼。
iappled
2018-03-09 14:13:59 +08:00
Promethues
dreampython
2018-03-09 14:15:17 +08:00
搜下 zabbix 等开源监控系统是不是你需要的
likexian
2018-03-09 14:26:43 +08:00
https://github.com/likexian/stathub-go 要简单就这个(好久没更新了,新版本难产中)
Vogan
2018-03-09 14:32:34 +08:00
推荐 zabbix

支持自定义设置阈值报警
支持自定义监控项
支持 api
...
awhane
2018-03-09 15:11:30 +08:00
同推荐 Prometheus。。。很简单了。
貌似不提供 aliyun 的 SD,可以用 file_sd..
ywgx
2018-03-09 15:31:06 +08:00
安利下 https://xabcloud.com 你需要
opengps
2018-03-09 16:56:29 +08:00
应该可以直接使用阿里云的接口吧
popoer
2018-03-09 22:29:40 +08:00
直接用阿里云监控有什么问题吗?还有免费的短信提醒

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/436510

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX