PVE 异常断电关机问题排查

2 天前
 xuemian

先想问下,这个 k10temp-pci-00c3 是代表什么温度?

root@pve:~# sensors
amdgpu-pci-e500
Adapter: PCI adapter
vddgfx:        1.35 V  
vddnb:         1.02 V  
edge:         +55.0°C  
PPT:          41.08 W  

k10temp-pci-00c3
Adapter: PCI adapter
Tctl:         +88.4°C  

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +20.0°C  

iwlwifi_1-virtual-0
Adapter: Virtual device
temp1:            N/A  

nvme-pci-0400
Adapter: PCI adapter
Composite:    +33.9°C  (low  =  -0.1°C, high = +82.8°C)
                       (crit = +84.8°C)
Sensor 1:     +33.9°C  (low  = -273.1°C, high = +65261.8°C)

这是我 PVE 的 sensors 记录,88.4 摄氏度是不是太高了,但是实际感觉是不热的。

还有一个问题就是,我是 CN 国标 220-240V 的适配器,标称输出 19v==6.32A ,输入 200-240V 50/60Hz 0.8A 最大~ 120W 目前人在澳大利亚,机器偶尔会出现突然关机的情况。无任何日志,并且 CPU 和内存负载都很低,PVE 也是处于 powersave 模式运行 还有一个信息是:我看 UPS 输出记录有时候是 246W ,澳洲的电力不是很稳定,但是已经有 UPS 稳压过了。 请各位大佬帮我看看,这是啥情况

353 次点击
所在节点    问与答
8 条回复
billlee
2 天前
k10temp 是 AMD CPU 的. 空载 88.4 是不正常啊。如果感觉不热,那就要考虑是不是 CPU 散热器没装好了,还是风扇不工作了?
xuemian
2 天前
@billlee 风扇都是工作的
billlee
2 天前
@xuemian 虽然概率很小,还是问问:膜撕了吗?硅脂涂了吗?
fionasit007
2 天前
我的 pve 正常关机后起不来了,一直卡在 loading initial ramdisk ,里面还有装的群辉数据我现在都不知道咋搞了
xuemian
2 天前
@billlee t-bao 的出厂没动过
xuemian
1 天前
Update:
我上了一个 3000 刀的电源稳定器稳定输出 240V ,内存、CPU 、硬盘满负载烤鸡一晚上稳定运行 10 小时,然后资源释放后过了不久,就又物理机自动断电后重启了。
WuDiHaiTai
1 天前
@xuemian 我真的很怀疑是散热器没撕膜,也符合高温断电重启的症状。建议拆开看看
xuemian
15 小时 45 分钟前
@WuDiHaiTai tbao 这款我不知道上盖如何打开,好像有固定件,但是不知道从何下手,问了客服还没回复。
但是奇怪的是我烤机 10 小时没有问题,但是释放资源后就挂了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1090792

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX