华南金牌的 X99 平台,之前可以 24-7 不间断运行了两个月,最近开始经常不定时地自动重启,排查了以下的两个原因:
- 系统原因:之前运行的是 Debian 12 ,这次换成了 Debian 10 。之前机器的 NVIDIA 驱动用的是 Debian 官方打包的包,这次换了 NVIDIA 的最新 CUDA+驱动
- 供电原因:主板 BIOS 没有开启来电启动,抱着对寨板 BIOS 不信任的态度自己试了试开机状态下拔电源再插上,确实没有启动
大家有没有排查过这种问题的经历呢?
华南金牌的 X99 平台,之前可以 24-7 不间断运行了两个月,最近开始经常不定时地自动重启,排查了以下的两个原因:
大家有没有排查过这种问题的经历呢?
1
feng0vx Jun 10, 2024 via iPhone
memtest 跑几圈看看,以前遇到过刚上电跑 memtest 正常,上电一天再跑有坏快
|
2
dbak Jun 11, 2024
看看 syslog 日志
|
3
shadowyw Jun 11, 2024
让让我想起了收集分析 kernel coredump 的日子...
|
4
acess Jun 13, 2024 via Android
我的老爷本子遇到过类似的,不是重启是断电。前两天还干脆不开机了。
然后我把 BIOS 芯片拆下来,用之前好的备份,编程器重刷了一遍貌似能开机了,但是不是还不定时断电就不知道了。 |