这是一个创建于 220 天前的主题,其中的信息可能已经有所发展或是发生改变。
CPU:鲲鹏 920
IaaS 平台:统信 ustack
虚拟机 OS:麒麟 v10 ( arm64 )
现象:基于统信虚拟化平台创建的虚拟机,在未部署业务系统的情况下,load average 经常会飙升到几百,导致系统卡死,ssh 连不上,可以通过 virsh console 连到虚拟机,发现终端一直在打印,手动敲几下键盘,等待日志刷完,通过 top 可以看到负载异常高,经常到几百,但却没有异常高的进程,稍等一会负载就会慢慢降下来,恢复正常。
通过 dmesg 查看,发现经常有类似这样的错误
kernel:NMI watchdog: BUG: soft lockup - CPU#0 stuck for 30s
rcu_sched self-detected stall on CPU
升级过内核,但问题依旧,有没有朋友遇到过类似情况,可以指点一下。