有没有这样的服务器监控/警报工具?

2017-12-27 16:46:37 +08:00
 param

网上找到的服务器监控工具都非常重量级,我只要一个工具能实现以下操作。

假设有如下场景,我有服务器 H 和服务器 S,在服务器 H 上跑了一个 HTTP 服务,在服务器 S 上跑了一个 scrapy 爬虫。 服务器 H 和服务器 S 各有一个脚本(例如 curl )用于检测服务是否正常工作。监控工具每隔一段时间(如 2 分钟)会执行一次脚本。每次检测完,如果正常工作则向另一服务器报平安,如果超出一定时间都没收到另一服务器报的平安,说明对方挂了,马上执行另一个脚本(如发邮件警报)

两台服务器同时挂的情况,可能就收不到任何通知,但我有 5、6 台的时候,同时挂的可能性就很少了吧。

或者有没有平台是专门做这种事情的?让服务器定时报平安,平台发现服务器超时了还不报平安,就要向我发邮件之类的。这样就是只有一台服务器也可以做到。

10390 次点击
所在节点    DevOps
48 条回复
zjb861107
2017-12-27 19:34:46 +08:00
类似的产品应该有很多吧,比如
腾讯云-云拨测

使用限制
腾讯云的注册用户,均可以免费使用云拨测。其免费用户,可使用的功能如下:

1) 14 个拨测点可供选择,覆盖一线城市
2) 最多可配置 10 个拨测任务
3) 每个任务最多可配置 5 个拨测点
4) 每个拨测任务最高拨测频率为 5 分钟一次
5) 支持所有的基础拨测功能
6) 支持免费短信告警
param
2017-12-27 19:37:35 +08:00
@zjb861107 看了一下,只支持 http、tcp 和 ping,也就是说必须要有外网地址
Terenc3
2017-12-27 19:40:35 +08:00
zabbix,不过需要写个脚本让 agent 调用,或用 SNMP。
param
2017-12-27 19:48:08 +08:00
@Terenc3
@kimoCHG
太重太复杂了,我说了,我只要上面提到的效果。

pushbullet 或许是一个不错的方案。
Technetiumer
2017-12-27 19:48:35 +08:00
uptime.io

你的報平安提供一個 API,然後用 uptime 查詢這個 API 有沒有“平安”的字符串

還可以根據狀態碼是不是 200 判斷

有一定免費的用量
Technetiumer
2017-12-27 19:49:34 +08:00
rrfeng
2017-12-27 19:53:30 +08:00
看起来感觉楼主是要用几台服务器互相检测存活吧

显然终极方案是搞一个类似于 raft 或者 paxos 的集群……发现掉线就报警(
nicevar
2017-12-27 20:00:16 +08:00
我自己做了个简陋的安卓客户端解决这个问题,当时还准备改良一下放 play 上去的,哈哈,看来这个需求还是有的
param
2017-12-27 20:08:27 +08:00
@Technetiumer 这个东西貌似。。还是只能发 http 请求检测网站。
Technetiumer
2017-12-27 20:12:08 +08:00
@param 可以 HTTPS 和 TCP
Technetiumer
2017-12-27 20:12:44 +08:00
@param 還可以檢查 HTTP 的內容有沒有某個字符串,沒有就是報警
Terenc3
2017-12-27 20:25:50 +08:00
好吧,其实我也有十几台虚拟机在跑服务,需求和你差不多,告警会同时通过邮件、短信和微信发送。

监控着电流、电压、湿度、露点、nginx、apache、mariadb、爬虫、ELK 集群、各种小米智能硬件的参数...

zabbix 是强大,不过确实比较麻烦。
param
2017-12-27 20:46:50 +08:00
@Technetiumer 那就必须要在我的设备上跑一个 http server,然后再搞个外网地址。。
xingwing
2017-12-27 20:56:33 +08:00
小米的 open-falcon
dasenlin
2017-12-27 21:10:16 +08:00
http://www.phpservermonitor.org/ php 的,布置相当简单,可检测 80 443 等自定义端口,也可以 ping 检测,显示 ping 值,邮件报警
param
2017-12-27 21:16:45 +08:00
@dasenlin 只监控网站没用啊。。
7654
2017-12-27 21:19:37 +08:00
@param #24 zabbix+python 效果很好,不管什么样的监控都能对付
param
2017-12-27 21:26:26 +08:00
@7654
@Terenc3
@kimoCHG

既然都认为 zabbix 好用,那么请问有没有简化版的 zabbix ?我不要那一套乱七八糟的东西。。
tianshiyeben
2017-12-28 07:01:56 +08:00
以前写的服务器监控工具,现在改成单机部署了,不知道是你要的嘛,http://www.wg900.com
v2gg
2017-12-28 08:31:55 +08:00
ServerStatus GitHub 上有 可以去看看

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/418052

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX