关于硬盘健康(坏道和 SMART)的一点教训和经验分享,希望可以帮到有需要的伙伴

2022-05-17 15:45:06 +08:00
 xvnehc

一块 17 年从 JD 买的 HGST 日立企业级硬盘( HUS726040ALE610), 这款盘最著名的就是炒豆子声音很厉害。

中间一直放在 DSM 里面使用,通电时间大概 40000 小时。

自从今年 2 月份以后,首次出现了异常断电的情况,我是有安装 UPS 的,当时用了这么久第一次出现也没有在意,进行了快捷 S.M.A.R.T 扫描无任何异常,然后继续使用。

后来 3 月份又出现了一次,感觉不对劲了,把盘拆下来进行了全盘坏道扫描,仍然没有问题,又陆续检查了 NAS 的散热和灰尘都良好,跟其他盘调换了接口继续使用。

直到这个月因为增加了一些大批量的数据,然后进行拷贝的时候频繁掉电,赶紧拆下来检查,最后进行了一次完整的 SMART 扫描才复现了掉电的问题,之前没有进行完整 SMART 主要是时间很长,大概 11 小时,而且一般碰到的硬盘问题都是坏道原因。

这次才发现完整 SMART 还是很有必要的,一点小教训吧,希望可以帮到有同样问题的人。

1305 次点击
所在节点    问与答
6 条回复
westoy
2022-05-17 15:53:43 +08:00
其实, 也有可能是供电或者 sata 线的问题
xvnehc
2022-05-17 15:56:30 +08:00
@westoy 已经清理过接口灰尘,并且和其他硬盘调换过接口,算是把可能的外围因素排除下。
datocp
2022-05-17 20:44:19 +08:00
这是我见过的最简洁的 smart 信息。。。
xvnehc
2022-05-18 03:25:36 +08:00
@datocp 没一个贴 SMART 信息啊,你看错了吧
datocp
2022-05-18 08:35:50 +08:00
根据网上的讨论基本监视这几个值
SMART 10 Spin_Retry_Count 起转重试次数
SMART 12 Power_Cycle_Count 启动-关闭循环次数
SMART 189
SMART 5 Reallocated_Sector_Ct 重新分配扇区计数
SMART 187 Reported_Uncorrect 报告的无法修正错误
SMART 188 Command_Timeout 命令超时
SMART 197 Current_pending_Sector 当前等待中扇区数(状态存疑 /不稳定-等待后续判断)
SMART 198 Offline_Uncorrectable 无法修正的扇区总数


这是一台用了 10 几年的希捷银河
SMART 5 25769803783

这是一台刚买 2 年的希捷银河,其中一个已经有问题
SMART 5 24
SMART 187 14
findex
2022-05-18 16:22:10 +08:00
我买的西数蓝盘 2T 。3 年多点,刚出质保就出现报错。还好上面没重要文件。然后入了炒豆子的日立企业盘 8T ,目前很稳。最稳的就是西数黑盘。当时 600 元买的 1T 黑盘,用了快 8 年,稳的没话说。还一块 320G 的 Thinkpad 拆下来的黑盘估计得十几年了,也是稳的没话说。黑盘比普通盘贵很多,但是睡觉能安稳些

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/853476

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX