V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。
toury
V2EX  ›  NAS

TrueNAS RaidZ-2 降级要怎么排查问题出在哪?

  •  
  •   toury · 37 天前 · 1067 次点击
    这是一个创建于 37 天前的主题,其中的信息可能已经有所发展或是发生改变。

    怎么确认是盘坏了,还是背板或者线?

    系统

    Truenas Scale

    5 盘 raidz-2

    西数的 6T 紫盘 运行累计 15000 小时, 预期寿命好像是 100 万小时吧 电源是金牌 650 瓦

    过程

    1. zfs Scrub 的时候,有一个硬盘报"读取错误:46",然后状态变成 FAULTED ,池 RaidZ-2 降级。

    2. SMART 长测和短测全部通过,没有报错

    3. 然后我重启系统后,zfs 通知,已经自动用别的盘修复了坏的盘里的数据 1.6G ,就是 zfs 的 Resilvering ,我什么都没做

    4. 这个时候池状态显示正常,原来显示 FAULTED 的盘现在也正常工作了,原来的读取错误数,被清零了

    5. 手动运行 Scrub ,扫池,这个盘又报“读取错误:17”,然后状态变成 FAULTED ,池又变回降级状态

    6. 再运行 SMART Long 和 Short ,2 个测试全部通过,都没错误。

    那么 SMART 测试通过,是不是说明硬盘没问题?

    9 条回复    2024-08-13 17:22:30 +08:00
    CapNemo
        1
    CapNemo  
       37 天前
    SMART 测试只是读取 SMART 报告,还是要以 scrub 为准,如果有备件的话换上去试试看就知道是哪里的问题了。
    Eleutherios
        2
    Eleutherios  
       37 天前
    一般是盘坏了,建议直接换一块。不信的话,从主板单独接一根 sata 直连硬盘看是否还故障试试。
    toury
        3
    toury  
    OP
       37 天前
    打算先换掉坏的盘,要是新盘没报错,就是盘的问题吧
    xustrive
        4
    xustrive  
       37 天前
    用 list 看下是哪个硬盘有 err 就知道了,换掉它就行了。
    Curtion
        5
    Curtion  
       37 天前
    我是取下来用 DiskGenius 扫了一下,有坏道,修复后就再也没有报错和降级了。
    337845818
        6
    337845818  
       37 天前
    建议检查一下供电

    我的 truenas 之前因为硬盘供电不足老是降级
    htfcuddles
        7
    htfcuddles  
       37 天前
    插一嘴,100 万小时是 MTBF 不是预期寿命。而且 1M 的 MTBF 算低的,消费级水平。
    toury
        8
    toury  
    OP
       37 天前
    @Curtion 坏道还能修复吗,只是数据坏了?
    toury
        9
    toury  
    OP
       37 天前
    @Curtion /dev/sde 3 Currently unreadable (pending) sectors. 好像还真是坏道
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1605 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 16:50 · PVG 00:50 · LAX 09:50 · JFK 12:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.