请求一下各位是怎么做报警监控的。特别是小组没有运维的情况下?

2016-12-09 16:13:23 +08:00
 chenqh
9102 次点击
所在节点    Python
42 条回复
goofansu
2016-12-09 16:45:12 +08:00
用 prometheus+granfa ,最近在做,很方便, grafana 4.0 新增了报警功能,可以对一个 panel 设置 alert ,状态改变就会发送通知
goofansu
2016-12-09 16:45:49 +08:00
如果追踪代码错误的话可以用 sentry
chinajik
2016-12-09 17:19:02 +08:00
没有人运维的情况下,直接写数据库,定时轮刷表最实在,通知可以注册一个企业号接微信的推送接口很方便。

报警监控做一套架构出来可以玩出花来,但是一旦要改造或者硬件条件不够就要死了。
derek80
2016-12-09 17:21:10 +08:00
@goofansu 还在用 3.0 , prometheus 自身也有报警功能的。
derek80
2016-12-09 17:22:09 +08:00
没有运维用现成的服务最好。
crayhuang
2016-12-09 17:27:07 +08:00
InfluxDB + Grafana ,效果还不错
suixn
2016-12-09 17:35:48 +08:00
在用 prometheus
zhchaos
2016-12-09 17:39:59 +08:00
riemann + influxdb + grafana
goofansu
2016-12-09 17:40:27 +08:00
@derek80 我知道本身那个,但是感觉配置 grafana 报警比较方便
beiping96
2016-12-09 17:46:55 +08:00
@goofansu suXiong
chenqh
2016-12-09 18:08:58 +08:00
@derek80 什么现有服务?是指 360 云报警这种吗
xiaoz
2016-12-09 18:13:41 +08:00
详细说明需求啊?你要监控网站运行? mysql 还是啥?
cloudinsight
2016-12-09 18:16:53 +08:00
cloudinsight.oneapm.com 40s 安装探针就可以用了,支持几十种基础组件监控
mx1700
2016-12-09 19:05:56 +08:00
@cloudinsight 赞一下
paulw54jrn
2016-12-09 19:16:17 +08:00
datadog + slack..
chohoor
2016-12-09 19:20:17 +08:00
用 ceilometer 啊
ywgx
2016-12-09 19:22:49 +08:00
xabcloud.com 可以解决你们继续的 基础运维,互联网跳板机,机器权限管理,应用集群监控,基础软件环境一键部署,支持异地多网络(机房)管理,信息通知,实时报警 联通 微信,企业工单
一个管理员账号 ops@xabcloud.com 密码 123456
hyuwang
2016-12-09 20:00:43 +08:00
datadog + pagerduty
knightdf
2016-12-09 20:02:38 +08:00
nagios 邮件报警,可以自己写监控脚本
zhuangzhuang1988
2016-12-09 20:12:06 +08:00
那就招人呗。。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/326461

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX