求助 Linux 服务器死机有哪些可能的问题

1 天前
 bingfengfeifei

有一台 Linux 工控机,最近频繁死机。具体的现象就是,PING 无响应,串口连接无任何反应。但是网线的灯是闪的,插拔网线也会亮灯和灭灯。长按电源硬重启恢复。开启 kdump 后,在/var/crash 中无任何文件产生,查看/var/log/messages 无任何异常日志,只是日志停在了死机的那一刻,串口也没有任何崩溃输出。 系统负载低,CPU 硬盘负载接近 0%,内存 15%左右,没有跑什么业务,设备的温度不高,都在 40-50°C 以下,死机的时候没有进行任何操作。

目前怀疑方向是前段时间厂家给这个设备加了两个 PCI 扩展卡,目前该扩展卡上面还插了两个 PCI 网卡,以及网卡上面有一个光模块,但是没流量。

这个问题有没有什么好的排查方向,目前在排除扩展卡,还是 PCI 网卡,还是插入的光模块导致。只能一个一个组件进行排除,但是该问题复现时间不确定,整个排查周期可能非常久。有没有什么其他更好的方向分析那个问题呢,还有上面新增的这几个硬件有没有可能导致这种现象发生呢

977 次点击
所在节点    Linux
5 条回复
Moyyyyyyyyyyye
1 天前
电源是否稳定,检查内存硬盘是否有问题,大概率是硬件问题
tomemi
1 天前
换个内核看看
yinmin
13 小时 2 分钟前
接显示器/键盘看看死机前有没有报错信息。

另外,你说的情况不一定 linux 死机,也许通过本机键盘能正常登录,只是网络故障。
hefish
12 小时 27 分钟前
硬件。。。慢慢换吧。。
sublimevsatom
2 小时 17 分钟前
用最新内核看看

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1074361

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX