zpool status 会误报损坏文件?

149 天前
 pikashi

话说 zpool status -v 会误报文件损坏吗?

系统是最新的 TrueNAS Scale 稳定版 Dragonfish

zpool 扫描后报错,我把里面报告的损坏文件用 sz 下载下来,和本地 Windows 上的副本一对比,winmerge 和 totalcmd 对比功能都报告两个文件一模一样。

本地的是刚用 bt 下载的,hash 校检过的所以应该是完好的。

可能是内存问题?

1838 次点击
所在节点    Linux
29 条回复
pikashi
149 天前
补充:报告错误的文件列表连续试了两个文件,和本地 PC 文件对比都是一模一样完好的
laminux29
149 天前
1.ZFS 是 Sun 公司开发的商业 FS ,TrueNAS 以及各种 Linux 发行版用的是其开源版本 OpenZFS ,两者不一样。

2.OpenZFS 就是有你说的这个问题,我自己按照完整的 OpenZFS 分层存储,包括 RaidZ2 的 HDD 、热备盘、Cache 盘、Write Log Zil Mirror ,都部署了,跑了半个月就是各种校验和错误。我深刻怀疑是 Bug 或者是开发者故意的。

3.建议有条件还是上分布式存储吧,毕竟 ZFS 是单机,存在单点问题,不适合生产。
xuan_lengyue
149 天前
@laminux29 是不是 SATA/SAS 控制器报的校验错误,检查连线和 EMI
xinmans
149 天前
@laminux29 truenas 的 zfs 还比较稳定,你用的什么版本?
pagxir
149 天前
基本上是硬件问题,除非是 zfs 版本比较老。zfs 对数据完整性比较严格,校验不对就报错。跟 btrfs 这种不太关注完整性的区别是,zfs 的话硬件有问题在文件系统层面就暴露出来了,而 btrfs 则到应用层才会反应出来。
Pteromyini
149 天前
zfs 很敏感,有一点点异常都会给你反馈出来,跟上面回复不同的是,目前 zfs 在生产环境应用很广泛,错误敏感是原因之一
xustrive
149 天前
@laminux29 #2 目前已知开源可以作为高可用的存储是 CEPH 还有没有其他推荐。 或者可以做双机热备的存储也可以。
wwd179
149 天前
我直接用 debian+openzfs 。跑 pt 。syncthing 文件同步。稳定运行了一年了,开启每周 scrub ,目前没啥问题。
hefish
149 天前
我发现 zfs 在硬盘超过 10 多块的时候,在大量小文件读写的时候,挺容易挂起的。 两台服务器,都是 14 个盘做的 zfs , 都有这种情况。 跑的 debian + openzfs 。
以前曾在 freebsd 上跑过十来个盘的 zfs ,没碰到类似问题。
laminux29
149 天前
@xuan_lengyue 不是控制器错误,12 个盘,一半有报错。盘与线在上线前都经过了测试。
laminux29
149 天前
@xinmans 没注意版本号,是 debian-12-5-0 使用 apt 安装的默认版本。
laminux29
149 天前
@xustrive google 用英文关键字搜 分布式存储。
laminux29
149 天前
@Pteromyini

ZFS 是单机模式,存在单点问题,生产谁用 ZFS 是纯纯的有病。
pikashi
149 天前
@xuan_lengyue 想试试从 EMI 角度入手,如果在 SATA 线外面贴铜箔胶布能起到抗干扰效果吗?
https://mobile.yangkeduo.com/goods.html?ps=KaXnhPxTRU
bluaze
148 天前
zfs 是自愈合的,如果你的 pool 是有冗余的,那么 zfs 在探测到数据损坏的时候就会即时修复
xuan_lengyue
147 天前
@pikashi 照理 SATA 线本身应该就有相应屏蔽之类,换根线试试?
pikashi
147 天前
@xuan_lengyue 我的是那种圆形很细的 SATA 线,有没有屏蔽还真不好说😅
woyaojizhu8
146 天前
@pagxir btrfs 不太关注完整性? btrfs 不是跟 zfs 一样可以有数据校验吗?能不能说说它不太关注完整性的具体表现?
woyaojizhu8
146 天前
@pikashi 那就换正常的 sata 线
taoky
130 天前
@laminux29 不开玩笑,「跑了半个月就是各种校验和错误」的话,建议跑一下 memtest 。我接触过多个跑了几年的 OpenZFS 阵列从来没遇到过 checksum 报错,如果 checksum 频繁出错的话,几乎可以确定是硬件问题。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1059337

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX