TrueNAS RaidZ-2 降级要怎么排查问题出在哪?

102 天前
 toury

怎么确认是盘坏了,还是背板或者线?

系统

Truenas Scale

5 盘 raidz-2

西数的 6T 紫盘 运行累计 15000 小时, 预期寿命好像是 100 万小时吧 电源是金牌 650 瓦

过程

  1. zfs Scrub 的时候,有一个硬盘报"读取错误:46",然后状态变成 FAULTED ,池 RaidZ-2 降级。

  2. SMART 长测和短测全部通过,没有报错

  3. 然后我重启系统后,zfs 通知,已经自动用别的盘修复了坏的盘里的数据 1.6G ,就是 zfs 的 Resilvering ,我什么都没做

  4. 这个时候池状态显示正常,原来显示 FAULTED 的盘现在也正常工作了,原来的读取错误数,被清零了

  5. 手动运行 Scrub ,扫池,这个盘又报“读取错误:17”,然后状态变成 FAULTED ,池又变回降级状态

  6. 再运行 SMART Long 和 Short ,2 个测试全部通过,都没错误。

那么 SMART 测试通过,是不是说明硬盘没问题?

1196 次点击
所在节点    NAS
9 条回复
CapNemo
102 天前
SMART 测试只是读取 SMART 报告,还是要以 scrub 为准,如果有备件的话换上去试试看就知道是哪里的问题了。
Eleutherios
102 天前
一般是盘坏了,建议直接换一块。不信的话,从主板单独接一根 sata 直连硬盘看是否还故障试试。
toury
102 天前
打算先换掉坏的盘,要是新盘没报错,就是盘的问题吧
xustrive
102 天前
用 list 看下是哪个硬盘有 err 就知道了,换掉它就行了。
Curtion
102 天前
我是取下来用 DiskGenius 扫了一下,有坏道,修复后就再也没有报错和降级了。
337845818
102 天前
建议检查一下供电

我的 truenas 之前因为硬盘供电不足老是降级
htfcuddles
102 天前
插一嘴,100 万小时是 MTBF 不是预期寿命。而且 1M 的 MTBF 算低的,消费级水平。
toury
102 天前
@Curtion 坏道还能修复吗,只是数据坏了?
toury
102 天前
@Curtion /dev/sde 3 Currently unreadable (pending) sectors. 好像还真是坏道

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1064520

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX