服务器 cpu ,磁盘 io 100% 占用, 无法 ssh 登录 应该怎么排查问题?

2024-01-03 14:22:43 +08:00
seth19960929  seth19960929

https://imgur.com/GUbunYm

1587 次点击
所在节点   服务器  服务器
14 条回复
zsj1029
zsj1029
2024-01-03 14:50:37 +08:00
竞价机器吗?有没有可能其他用户影响的
seth19960929
seth19960929
2024-01-03 15:04:23 +08:00
@zsj1029
看了 ucloud 后台显示的是: 快杰型 O, 不是共享的
julyclyde
julyclyde
2024-01-03 16:16:56 +08:00
看一下 console 有没有内核输出的错误信息
pelloz
pelloz
2024-01-03 16:19:43 +08:00
大概率是有一个程序在狂写日志,你去找到这个不正常大小的日志就能找到对应的程序了
seth19960929
seth19960929
2024-01-03 18:12:37 +08:00
@julyclyde
@pelloz 有没有记录进程的排行的方式? 比如 2 s 记录一次
julyclyde
julyclyde
2024-01-03 19:25:52 +08:00
@seth19960929 你自己写一个呗,sleep2 循环看一遍/proc 再 sleep2
nagisaushio
nagisaushio
2024-01-03 19:27:27 +08:00
有可能在 swap
seth19960929
seth19960929
2024-01-03 20:47:00 +08:00
@julyclyde 放弃这个,想找个成熟一点的方案
@nagisaushio 不应该直接干到 100% 吧
jazzsama
jazzsama
2024-01-03 21:08:15 +08:00
腾讯云搭的 qBittorrent 服务器,也遇到了 CPU 跑满的情况

重启一下就可以再次使用 SSH 登录

PS. 腾讯云重启特别慢,实测 15 min 以上
seth19960929
seth19960929
2024-01-03 22:01:59 +08:00
@jazzsama 有找到是什么进程问题吗
creating
creating
2024-01-04 19:42:13 +08:00
我的腾讯云也遇到过好几次,IO 突然 100%,然后什么都不能操作,只能强制重启,重启时间也很长,
特别是在大量操作文件时遇到的概率大,没找到过原因,重启之后一切正常。
samyucn234
2024-01-10 18:23:59 +08:00
先 top 再 kill
seth19960929
2024-01-11 10:20:07 +08:00
@samyucn234 看描述, 服务器已经连接不了了, 而且我不是要 kill, 我是要找到是谁占用高
corningsun
2024-01-31 16:57:12 +08:00
atop 可以设置采集间隔,然后回溯到任意时间。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1005482

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX