生产服务器 RAID5 挂了一块盘,最佳实践是马上补上一块重建还是立即备份全阵列,备份完再补盘?没有备份,数据不丢失比短期可用重要。

70 天前
 drymonfidelia
3625 次点击
所在节点    程序员
35 条回复
totoro625
70 天前
立即备份
yyzh
70 天前
生产的不是都要求 321 的么?
drymonfidelia
70 天前
@yyzh 小厂,领导不懂技术
xiaobai1213
70 天前
立即备份
Guest321
70 天前
立刻马上备份,然后再补盘
Keuin
70 天前
仅理论分析一下,raid5 每个盘存储的都是奇偶校验信息,没有存原始数据的盘,因此备份和重建都需要读所有盘的所有内容。丢数据是坏了两个盘,现在已经坏了一个,备份跟重建都是要读所有盘,因此没有区别,怎么样都可以。
drymonfidelia
70 天前
硬盘里存的是用户上传的图片,判断不了哪些重要
我刚接手就坏了盘,坏盘前我都不知道居然没备份
photon006
70 天前
分析 smart ,docker 跑一个 scrutiny 看看
adrianzhang
70 天前
@drymonfidelia 赶紧备份。折腾啥之前也得先备份。
drymonfidelia
70 天前
目前已经把新数据全部存到新盘上了,旧数据靠 CDN 缓存先撑着,一堆 404 就没办法了
lithiumii
70 天前
Raid 6 ,炸了一块,报警一块。一开始想一块一块换,结果每换一块就坏一块新的。三次之后备份再全换了。早知道就直接备份的。
drymonfidelia
70 天前
@lithiumii 服务器每天因为各种无关紧要的原因报警,真的有问题的时候反而没人在意了
Pteromyini
70 天前
刚给隔壁发的,复制一份
个人观点:
阵列提供服务保证,备份提供数据保证
RAID0:提高顺序性能->增强存储服务质量
RAID1-X:冗余数量内硬件损坏不中断服务提高系统 SLA->增强存储服务持续性
热备、冷备、异地:提供数据备份和安全保证。
家用或者某些临时写入场景,冗余阵列的目的基本是保证提供最低限度服务和有机会导出阵列内的资料而不是直接重建。
个人认为:
正确做法是:导出资料、上热备、下线出错阵列、线下尝试恢复阵列或者抛弃
cpstar
70 天前
RAID 是保证磁盘在线,而不是保证数据在线,一旦出问题,必然要在现状下保护数据全都搞出来——其实更应该在平时做好第二遍备份,出问题时加急做一次增量或者全量。
StinkyTofus
70 天前
@Keuin #6 怎么可能没区别 , 别误导别人了, 第一时间就要备份再重建。
busier
70 天前
先备份,一般来说其它盘也都是同时期的硬盘,即便没报错也是风烛残年,RAID5 重建过程中很有可能继续阵亡!
vibbow
70 天前
最佳实践是上 raid 6 😂
laminux29
70 天前
1.生产环境,数据是需要 3 个副本的。有 raid 的存储,只能算一套。另外还需要存储备份一体机,最后再来一套磁带或冷备盘,这样基本的 3 副本就形成了。

2.raid 存储是需要热备盘的,热备盘的意思是,平时作为冗余盘,当 raid 中有盘坏了,热备盘会立即自动顶上去。热备盘的作用是,把故障的维护响应时间降低为零,为运维争取处理时间,因为运维不可能 7*24 盯着系统。
hefish
70 天前
要是觉得剩下几块硬盘质量好,那就先补盘,
要是没把握,那就先备份。
Jhma
70 天前
看每块盘的容量大小,每盘大于 4T 的重建时间有点久,可以备份一些重要数据后在重建,若备份 TB 级别的全部数据也怕坏第二块盘

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1057008

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX