再次遭遇 BTRFS 文件系统损坏事件

2023-09-15 11:15:34 +08:00
 CitizenR

主机系统Fedora 37,安装在一颗固态硬盘上。

最近某日开机直接进GRUB命令行界面,使用 live 盘进去一看,只剩EFI分区,原BTRFS分区显示unlocated

相较之下,另一台Fedora主机,使用XFS文件系统,稳定运行数年;一台Ubuntu主机,使用ext4+XFS文件系统,从2004一路升级至2304,也稳定运行数年。

再早前另一台机器安装的Manjaro使用BTRFS也出现过开机系统直接没了的事情。

两次独立的文件系统损坏事件想要再让人相信BTRFS稳定可靠已不可能了。

大家可以分享一下Linux文件系统遭遇过的类似惨剧,如果有的话;或者,BTRFS文件系统稳定运行的个例。

5706 次点击
所在节点    Linux
43 条回复
python35
2023-09-15 11:17:38 +08:00
我的群晖瑟瑟发抖
anytk
2023-09-15 11:28:40 +08:00
btrfs + compress=zstd 跑了 3-4 年了,系统也迁移了几次换了盘,没啥问题
anytk
2023-09-15 11:30:29 +08:00
系统是 debian sid, 一直用最新内核,挂载参数 noatime,compress=zstd
514146235
2023-09-15 12:17:28 +08:00
应该是从 kernel 3.x 开始用 btrfs ,全部系统都是 btrfs ,有全 hdd 的,有全 ssd 的。经历过至少十几次的 device add, del ,没有出现过任何问题。几乎都是 7 * 24 小时运行,也没有 ups ,几年可能也会有一两次意外停电。

包括冷备服务器也是 btrfs ,会开启 compress=zstd ,而且硬盘还是 smr ,除了性能差,稳定性没有问题。

linux 版本主要是 archlinux ,内核 lts 滚动升级。
Jirajine
2023-09-15 12:22:49 +08:00
以前双系统被 btrfs for Windows 驱动弄坏过一次,不过数据都恢复出来了。
leonshaw
2023-09-15 12:30:04 +08:00
bcachefs 咋样了
longxk
2023-09-15 12:35:47 +08:00
这种情况有没有可能是 SSD 出问题了?
毕竟群晖和 SUSE 都在线上大量使用 BTRFS 了,应该没那么不堪吧。
libook
2023-09-15 12:38:08 +08:00
从 Debian11 推出就开始用 Btrfs 了,没有因为这个文件系统出过问题。

最近一次 NAS 出问题是每天早上掉盘,但数据没坏,持续了大约半个月,一开始我还以为是文件系统问题,但跟文件系统开发者一起 debug 一阵之后没发现问题在哪,后续推测可能是硬件问题,换了新硬盘果然问题不再出现,可能本身就有质量缺陷用了 4 年就提前发作了(厂商检测后确认问题并给我换新了)。

现在我用了不少 Btrfs 子卷快照增量备份方案对系统盘和重要数据进行备份,用 btrbk 脚本也挺稳的。
pagxir
2023-09-15 13:04:51 +08:00
@514146235 只能说明你用的不够多,强度不够大。看这些年 btrfs 的 bug 列表就知道了。这东西能用也好用,但是说稳定我不同意
flyqie
2023-09-15 13:53:55 +08:00
最稳的还是 ext4 。。
willamtang
2023-09-15 14:07:54 +08:00
话说,我的程序员同事,用 Fedora ,开始用的 btrfs ,弄崩了,又用 xfs ,又崩了,最后换了 CentOS+xfs 倒是稳住了。
enihcam
2023-09-15 14:09:49 +08:00
有没有一种可能,你使用了一个 btrfs buggy 的 linux 内核,然后还不知道(或不愿意)升级?

不然,换成最新的 LTS 内核试试?截至 2023/09/15 ,最新的 LTS 内核是 6.1.53 。
chronos
2023-09-15 14:13:40 +08:00
btrfs 崩溃的时候最好检查一下硬盘本身是不是正常的。我以前也崩过几次 btrfs ,其中有两次都是硬盘本身出了问题,还有一次硬盘盒不稳定导致的。
a632079
2023-09-15 14:30:19 +08:00
之前跑 Unraid 缓存盘调用策略 Raid0 用 btrfs ,有些忘记去管 BT 下载进度了,回来一看写满了,btrfs 在内核疯狂报告 corrupted data ,以及盘变成 Readonly……经过官方手册,以及网上(英文)流传的一些抢救方案,没救回来……哪怕 Readonly 的情况,也就抢救回来了百分之四十左右的数据,大概 四百五百 G 的资料丢失了……从此我就不在觉得 BTRFS 可靠了。
PP.SS 现在 Unraid 官方支持 ZFS 了,重新做缓存盘成 ZFS ,现在稳如老狗了已经。BTRFS 是啥?真不熟( tui )
a632079
2023-09-15 14:34:10 +08:00
@enihcam #12 原文:“有没有一种可能,你使用了一个 btrfs buggy 的 linux 内核,然后还不知道(或不愿意)升级?不然,换成最新的 LTS 内核试试?截至 2023/09/15 ,最新的 LTS 内核是 6.1.53 。”
======
回复:Fedora 默认的更新策略和 ArchLinux 一样,都是直接滚最新的内核。但至少也不应该在 Stability 为 OK 下 BOOM 的吧,要知道,这可是文件系统……

稳定性参考: https://btrfs.readthedocs.io/en/latest/Status.html
P.S:让我们假设 UP 使用的都是 Stability 为 OK ,譬如 RAID56 的特性
cheng6563
2023-09-15 14:34:19 +08:00
没 ecc 内存没数据校验,说不定你 ext/xfs 文件系统的数据也损坏了部分,但你没有发现而已。
cheng6563
2023-09-15 14:35:46 +08:00
btrfs 每次读写都有数据校验,发现校验和不对就会尝试从 raid 中修复,修复不了就会直接 readonly 。
mark2025
2023-09-15 14:55:20 +08:00
要么陈旧稳定的 ext4 , 要么高效稳定的 xfs ,其它小众文件系统不要放重要资料
zhixi
2023-09-15 14:59:09 +08:00
在 Archlinux 下用了两年的 Btrfs 了,没出过什么问题,一开始比较担心,后来就没管过。
楼上说的对,确实有的时候 ext4 坏了都不知道的
hyperbin
2023-09-15 15:12:56 +08:00
我也崩过,不过一看 SSD 的 smart 时发现 0E 变成 2 了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/974021

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX