先列举几个日常遇到最多的问题:
监控
auto scaling
是否实现了对集群做到了 auto scaling, 比如一键添加节点.
只想少加班, 求老哥指导指导.
1
Lax 2018-12-22 20:53:21 +08:00
一般是基础的资源指标,以及跟业务健康状态直接相关的运行指标。按数据来源又区分机器 /网络方面数据,java 虚拟机层次数据,业务应用层次数据。
关于监控,看一下 braden gregg 的 USE 方法: http://www.brendangregg.com/usemethod.html 基本能回答怎么监控,监控什么的问题,应该能顺带解决要不要去 auto scaling。 |
2
594duck 2018-12-23 07:59:58 +08:00 via iPhone
jmxtrans+influxdb+grafana
主要收集两个 gc,cou 使用和总内存消耗。其他自己挑。 |