btrfs corrupt 数量持续增长 原因是啥呢?

2023-07-24 13:26:43 +08:00
 yjcn

unraid 上拿了块爱国者 p5000z 当缓存盘,默认使用的是 btrfs 发现 corrupt 一直在增加,是固态硬盘体质的问题吗? Google 了一波 unraid 官方都是建议跑下 memetest86 排除下内存原因 我跑了 2 次都是 pass 看着不是内存的锅

Jul 24 12:47:01 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 192, gen 0
Jul 24 12:47:01 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 352 off 679936 csum 0xd522135e expected csum 0xf038c045 mirror 1
Jul 24 12:47:01 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 193, gen 0
Jul 24 13:15:05 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 286 off 4337909760 csum 0x2b937fde expected csum 0x9fed556b mirror 1
Jul 24 13:15:05 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 194, gen 0
Jul 24 13:19:51 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 272 off 1601867776 csum 0x55387ecc expected csum 0x294104e2 mirror 1
Jul 24 13:19:51 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 195, gen 0
Jul 24 13:20:03 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 278 off 9227800576 csum 0xc036916f expected csum 0x4b8aade4 mirror 1
Jul 24 13:20:03 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 196, gen 0
1770 次点击
所在节点    Linux
11 条回复
cheng6563
2023-07-24 14:14:52 +08:00
内存不带校验的话基本就是内存问题了,这种跑测试一般跑不出来的。
有 RAID 吗?有的话能自动修复吧。
yjcn
2023-07-24 14:21:15 +08:00
@cheng6563 木有加 raid 那这种内存问题还比较尴尬 请问还有啥定位方法吗? 两条科赋的 ddr4 3200 条子 之前在主力机上 打游戏好像也没出现啥问题 后来放到 nas 上了
cheng6563
2023-07-24 15:53:03 +08:00
@yjcn 普通内存就是这样的,你以前打游戏没出问题是因为 NTFS 根本没带校验出了问题你也不知道。
mokiki
2023-07-24 16:10:04 +08:00
硬盘问题的可能性更大
yjcn
2023-07-24 16:47:46 +08:00
@cheng6563 好吧 这就比较难受了 如果 memtest 这种测不出来 就只能排除法试试了 先换一对内存条子试试看 主要是还不好排除其他因素影响 比如 @mokiki 老哥说的也可能是硬盘的锅
yjcn
2023-07-24 16:53:07 +08:00
或者换个文件系统 不行就切回 xfs ?
yanqiyu
2023-07-24 17:07:18 +08:00
dmesg 里面可能有具体出问题的文件路径
以及可以跑一遍 scrub 看看具体怎样
wizardyhnr
2023-07-25 23:19:35 +08:00
smartmoontools 能看见 Media and Data Integrity Errors 不,会不会已经有 0E 了.
yjcn
2023-07-26 12:49:53 +08:00
@wizardyhnr 木有 盘是新买的 也 check 过 smart 没有 0e 就很迷
yjcn
2023-07-26 12:50:36 +08:00
换了对内存条 发现还是会有 corrupt 难受了 到底是啥原因呢。。。
busier
2023-07-26 19:29:39 +08:00
盘的问题!说白了,相当于你在硬盘 btrfs 文件系统上存了一大堆文件,然后在读的时候,被 btrfs sum check 发现与存的时候不一致!

排除内存问题导致的计算错误!大概率就是硬盘问题!

还有一种小概率的可能性,就是另一个直接以设备块方式操作硬盘的程序(例如 dd )绕过 btrfs 文件系统,直接在写硬盘块设备!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/959206

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX