V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
yjcn
V2EX  ›  Linux

btrfs corrupt 数量持续增长 原因是啥呢?

  •  
  •   yjcn · 283 天前 · 1483 次点击
    这是一个创建于 283 天前的主题,其中的信息可能已经有所发展或是发生改变。

    unraid 上拿了块爱国者 p5000z 当缓存盘,默认使用的是 btrfs 发现 corrupt 一直在增加,是固态硬盘体质的问题吗? Google 了一波 unraid 官方都是建议跑下 memetest86 排除下内存原因 我跑了 2 次都是 pass 看着不是内存的锅

    Jul 24 12:47:01 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 192, gen 0
    Jul 24 12:47:01 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 352 off 679936 csum 0xd522135e expected csum 0xf038c045 mirror 1
    Jul 24 12:47:01 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 193, gen 0
    Jul 24 13:15:05 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 286 off 4337909760 csum 0x2b937fde expected csum 0x9fed556b mirror 1
    Jul 24 13:15:05 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 194, gen 0
    Jul 24 13:19:51 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 272 off 1601867776 csum 0x55387ecc expected csum 0x294104e2 mirror 1
    Jul 24 13:19:51 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 195, gen 0
    Jul 24 13:20:03 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 278 off 9227800576 csum 0xc036916f expected csum 0x4b8aade4 mirror 1
    Jul 24 13:20:03 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 196, gen 0
    
    第 1 条附言  ·  281 天前
    换了对内存条 发现还是会有 corrupt 难受了 到底是啥原因呢。。。
    第 2 条附言  ·  269 天前
    现在看起来也不是固态硬盘的锅 换了块 pc005 也是一样的表现 现在发现连续写入就会出问题 太难了 难道是 cpu 或者主板的锅? cpu 我确实是 12 代 es qygd 之前没加固态用着没啥问题 主板是精粤的 b760i 搞不懂了
    11 条回复    2023-07-26 19:29:39 +08:00
    cheng6563
        1
    cheng6563  
       283 天前
    内存不带校验的话基本就是内存问题了,这种跑测试一般跑不出来的。
    有 RAID 吗?有的话能自动修复吧。
    yjcn
        2
    yjcn  
    OP
       283 天前
    @cheng6563 木有加 raid 那这种内存问题还比较尴尬 请问还有啥定位方法吗? 两条科赋的 ddr4 3200 条子 之前在主力机上 打游戏好像也没出现啥问题 后来放到 nas 上了
    cheng6563
        3
    cheng6563  
       283 天前
    @yjcn 普通内存就是这样的,你以前打游戏没出问题是因为 NTFS 根本没带校验出了问题你也不知道。
    mokiki
        4
    mokiki  
       283 天前   ❤️ 1
    硬盘问题的可能性更大
    yjcn
        5
    yjcn  
    OP
       283 天前
    @cheng6563 好吧 这就比较难受了 如果 memtest 这种测不出来 就只能排除法试试了 先换一对内存条子试试看 主要是还不好排除其他因素影响 比如 @mokiki 老哥说的也可能是硬盘的锅
    yjcn
        6
    yjcn  
    OP
       283 天前
    或者换个文件系统 不行就切回 xfs ?
    yanqiyu
        7
    yanqiyu  
       283 天前
    dmesg 里面可能有具体出问题的文件路径
    以及可以跑一遍 scrub 看看具体怎样
    wizardyhnr
        8
    wizardyhnr  
       281 天前
    smartmoontools 能看见 Media and Data Integrity Errors 不,会不会已经有 0E 了.
    yjcn
        9
    yjcn  
    OP
       281 天前
    @wizardyhnr 木有 盘是新买的 也 check 过 smart 没有 0e 就很迷
    yjcn
        10
    yjcn  
    OP
       281 天前
    换了对内存条 发现还是会有 corrupt 难受了 到底是啥原因呢。。。
    busier
        11
    busier  
       281 天前
    盘的问题!说白了,相当于你在硬盘 btrfs 文件系统上存了一大堆文件,然后在读的时候,被 btrfs sum check 发现与存的时候不一致!

    排除内存问题导致的计算错误!大概率就是硬盘问题!

    还有一种小概率的可能性,就是另一个直接以设备块方式操作硬盘的程序(例如 dd )绕过 btrfs 文件系统,直接在写硬盘块设备!
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2381 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 12:53 · PVG 20:53 · LAX 05:53 · JFK 08:53
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.