[提问]运维同学一般看性能硬件这种监控到底在看什么啊?

2022-10-24 23:41:46 +08:00
 foufoufm

经常业务上有给硬件设备做性能监控的需求,搞来搞去也就 3 个指标:CPU 、内存和磁盘占比。

我想知道的是,看这三个指标有啥用。。。监控的意义在哪里?

1023 次点击
所在节点    问与答
8 条回复
waringid
2022-10-25 07:38:59 +08:00
试着回答以下几个问题:
1 、业务的高峰期是什么时候?访问量是多少?有哪些服务器资源?高峰期服务器资源占用情况如何?
2 、新上线的业务预估访问量比旧业务高 10 倍,能不能公用服务器?新购服务器需要什么配置?
3 、业务量没有变化为什么访问变慢了?
3 、各历史业务高峰期服务器资源变化有什么特点?
foufoufm
2022-10-25 10:32:56 +08:00
@waringid 谢谢,很专业。我再调研一下公司内部人员。先结帖吧。
perfectlife
2022-10-25 10:44:23 +08:00
一般做了也不天天看,最多内存 /cpu 高报警了看一下,磁盘占比主要是怕磁盘满了,影响服务
foufoufm
2022-10-25 12:44:36 +08:00
@perfectlife 太真实。。。
perfectlife
2022-10-25 13:08:20 +08:00
@foufoufm 对运维来讲,基本不看但是监控得有,不然背锅还甩不掉
foufoufm
2022-10-25 13:43:33 +08:00
@perfectlife 一般是怎么甩锅的?想了解一下哈哈哈哈
lixile
2022-10-25 14:34:15 +08:00
cpu 平均负载 峰值负载 满负载时长 (决定扩容与否)
内存 内存使用比例 (决定扩容与否)
磁盘 使用率(决定扩容与否)
每秒读写 每秒 iops 每秒 I/O 操作耗时占比 每次 I/O 读写耗时 (决定了硬件选型 机械 sata_ssd nvme_ssd 容量优先、读优先、写优先等等)
打开文件描述符数量、每秒上下文切换次数
网络 io 每小时流量 (评估交换机峰值流量)
每秒网络带宽使用 (评估网卡选型与扩容)
网络 socket 链接类型与数量
perfectlife
2022-10-25 15:58:00 +08:00
@foufoufm 比谁嗓门大

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/889542

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX