Linux (pve)过热(猜测)死机,可能是 CPU、主板问题还是固态硬盘、内存条问题

212 天前
 sekisui
主机:倍控 N100 主机
状态:塞进弱电箱,散热一般
nvme:金士顿 1T nvme (机械革命自带换下来的,否则不会买)
内存条:阿斯加特 16G DDR5
系统:pve8.1 系统,跑了 openwrt 和一个 lxc 的 debian
现象:会出现不定时死机,状态是全死,pve 管理口和 openwrt 独立的 lan wan 全部不通
不会自动重启
买到手没有用 win 测一下压力,这一点怪我

由于只有周末回家,想着做一些前期预案(买固态硬盘 or 内存条)方便快点解决。

现在想让大家帮忙推测下,Linux 系统出现死机,且不重启,主要可能是 CPU 高温死机还是固态硬盘或者内存条
因为印象中 CPU 撞墙会降频或者重启
固态硬盘只碰见过掉盘或者无法写入
内存条有问题比较玄学
谢谢大家帮忙
1322 次点击
所在节点    云修电脑
13 条回复
sekisui
212 天前
当然自我替换硬件测试是最好的,开这个帖主要是想通过现象做一个前期猜测,比如感觉是固态问题就京东先下单,感觉偏向于 CPU 或者主板那就到时候想办法复现
JensenQian
212 天前
你这 nvme 固态+这种没啥散热能力的小主机,都是发热大户,还塞弱电箱里面
最好的选择就是直接放外面,买个小风扇放旁边对着吹
ajaxgoldfish
212 天前
个人遇见的夏天无厘头重启就是 cpu 虚焊导致重启,一个笔记本,一到夏天热了就重启,冬天屁事没有。
rojer12
212 天前
盲猜一手硬盘,这些东西里面只有硬盘是最容易出问题的
ferock
212 天前
不要放小洞里…就没事
M48A1
212 天前
之前我安装了 Windows server 遇到过太热了,虚拟的 ikuai 丢包

直接安装 PVE 目前没有出现这种情况,感觉 pve 还是很节能~
bjzhou1990
212 天前
换 esxi 试试?我都稳定运行 1 年了
Mithril
212 天前
PVE 的 kernel 有 bug ,会导致虚拟机 CPU 使用率极高然后直接卡死。
大概是 8.1 还是哪个版本的改了,不过不确定你用的各种包版本对不对。
你可以先试试升级了再说。
lancelock
212 天前
这被动散热的,放外面都发烫,放弱电箱更不行了
minami
212 天前
可能是供电不足,BIOS 里把 PL1/PL2 降下来,如果症状消失,建议退货,这是主板设计问题
sekisui
212 天前
@JensenQian 换成 sata ssd 会不会好些,我以为 nvme 更耐造,毕竟软路由什么的对硬盘性能没什么要求
JensenQian
211 天前
@sekisui 还是整个散热,比硬盘简单
impdx
207 天前
linux 看日志就行了,把日志贴出来,就不用瞎猜了。最好接上显示器和键鼠看看 tty 能不能正常进,因为死机会重启的。下次死机看看 tty 能不能进,

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1035438

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX