一起因硬盘 APM 设定值被不停地重置为 128 而最终发现的, SATA 供电线接触不良(非常轻微)的故障

2020-09-19 19:11:01 +08:00
 ungrown

家里自组的 NAS (完全没有 NAS 该有的样子)自打四年前服役以来,每年总是会遇到两三起软硬件故障

虽然基本但是我作死,操作、配置不谨慎居多,硬件本身鲜有大毛病,个别配件可能会闹些小脾气

HDD 的供电线是用一转二 SATA 供电线扩展出来的口,其实以前就发现过接触不良的现象,但当时用热熔胶加固后就一直没有复发过

因为这块 HDD 是用 hdparm 设置成禁用 APM 的(-B255 ),几年来一直如此

但最近几天发现它总是自己变成 APM=128 (上电后的默认值),哪怕手动输入hdparm -B255之后,过不了多久还是会变成 128

然而从没想过是电源线的事情

今天休息,依然发现这个现象,耐不住自己的疑心病,把机箱侧板打开,没过一会儿就听到了很不妙的声音

是 HDD 掉电停转时磁头复位伴随转速下降的声音,然而还没停稳,紧跟着就是重新上电时电机发力的声音

不好!

观察了好一会儿,发现这个现象时不时会发生,但是间隔并不一定,也没什么规律,试着去各种角度折弯供电线,但并不会让这种掉电又立刻上电的现象变得可控,也对,一分二线的转接处早就被我胶死了,接触不良的地方肯定另有它处

想了一会儿,问题根源也找到了,至于到底哪里接触不良也不纠结了,直接把 HDD 和装系统的垃圾 SSD 的 SATA 供电线交换了一下

这个看似怠慢的举动其实是有道理的,既然之前 HDD 接这根线是隔几分钟掉电并且立刻上电的话,那么说明这根线接触不良的情况很轻微

SSD 吃电很少,其内部有额外的板载直流电源模块,配合数量不算少的滤波电容,这么轻微的波动,对 HDD 而言不能容忍,但对这块 SSD 来说应该问题不大

怀着忐忑(并不)的心情换完电源线后,重启,到现在已经过去 9 个小时,还没看到关于 SSD 的报错或者警告日志,而 HDD 也不再掉电复位,一切似乎岁月静好

再观察几日

(只是可怜了这块 HDD,这么想来,前前后后它忍受这样恶劣的供电足足持续了一个多星期,难怪前几天上面的 ZFS 因为校验错误丢了整整一个目录,还好有镜像,数据并没丢。这块硬盘也买来四年多了,目前来看没有什么不良预兆,希望这次的供电问题没有对它造成太大影响)

2181 次点击
所在节点    硬件
3 条回复
hoffman
2020-09-19 22:00:50 +08:00
HDD 供电一般只用电源直接出来的供电口,不敢用一分二转接。模组电源的话,每条模组线最好也不要超过 4 个 SATA 供电口,以防供电不足。
ungrown
2020-09-19 22:49:39 +08:00
@hoffman #1 不是标准 ATX 电源,是 DCATX 模块( 120W ),只有一个 SATA 电源输出,有三个 SATA 设备需要供电,SSD,HDD,蓝光刻录机,非得分不可
cmheia
2020-09-20 10:44:19 +08:00
糊了塑料壳不过是定形,真正决定接触状况的是里面的金属簧片。簧片(几分一个)、压线钳(几十一把)安排一下。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/708604

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX