@
clino @
imydou 硬盘的可靠性指标,除了 MTBF 外,还有一个很重要的 BER ( Bit Error Rate )。
BER is Bit Error Rate. BER is a measure of read error rates for disk drives.
1 、普通的 SATA ,每读取 2-3TB ,就会出现一次 BER 。
当阵列挂了,需要 rebuild 的时候,这么大的硬盘容量,加上数个硬盘组成的 RAID5 ,出现读取错误的可能性是非常大的。
出现读取错误,那 rebuild 就会失败。
2 、硬盘的密度越来越高,可能很多数据都是冷数据,不读取不会知道这些数据的情况。
实际上可能多块硬盘在某些位置已经出现坏道。
当读取到某块硬盘的坏道的时候,阵列就会降级。
rebuild 的时候,所有硬盘的所有数据都需要参与到 rebuild 的任务
假如其他硬盘还有隐藏的坏道,平时没有察觉, rebuild 就必然会暴露
很不幸,结果也是 rebuild 失败
有些阵列卡好像有跳过错误,强行 rebuild 的功能,当然 rebuild 后会有部分数据错误。
在 RAID5 花去的人力物力和时间,还有可能的数据损失,实在是不值那几块硬盘的钱。
大容量硬盘,不推荐校验型的阵列,包括 RAID5 、 RAID6 、 RAID60 这些。可以用 RAID1 、 RAID10
需要校验类型的阵列,可以使用 ZFS 。