生产服务器 RAID5 挂了一块盘,最佳实践是马上补上一块重建还是立即备份全阵列,备份完再补盘?没有备份,数据不丢失比短期可用重要。

70 天前
 drymonfidelia
3624 次点击
所在节点    程序员
35 条回复
securityCoding
70 天前
@laminux29 老哥问个问题,云厂商一般支持挂载一个 ssd 啥的,他们这种是什么备份机制呢
laminux29
69 天前
@securityCoding

支持挂载 SSD ,这只是一个功能,与备份机制无关。

云厂商底层,仍然是硬件阵列卡。

如果需要备份,最佳策略是,根据备份的要求与预算,直接找云厂商谈,问他们要方案。
dann73580
69 天前
备份然后换 R10 。生产一般都是配 R10 的。
skvi
69 天前
@Keuin 那不就是先备份更优吗?怎么会没区别?
letmedie
69 天前
确实没太大的区别,你备份也好重建也好,都是看脸的,因为降级状态读出来的数据一部分是算出来,备份优先的话是因为万一备份过程中炸了至少拷贝出来的数据是可用的,重建过程中炸了那就只能上数据恢复了,当然恢复成功率会比较高。关键一个是看你单盘的容量,另外一个就是看你重要的数据的量级。
nuk
69 天前
一般是补上一块重建,毕竟企业级硬盘没那么容易坏。备份是日常作业,现在备份也晚了,除非里面有部分数据是完全不容许丢失的,不过既然都没有备份策略的话,里面的数据大概是无关紧要的。
letmedie
69 天前
备份应该作为一个日常性的事务,重要的数据需要多副本冗余,而不应该用来作为阵列降级后的抢救措施。另外也不必太过推崇 R10 ,R10 是需要高性能的 IO 下比较好的选择,但是对空间浪费严重,而且万一出现坏盘的情况,极端情况下坏两块盘同样可能炸阵列,要看坏的第二块盘在哪里,有高 IOPS 的需求的话,SSD 会是更好的选择,所以一般生产环境下,RAID6 是个不错的选择,虽然写惩罚会更严重,但是安全性和经济性比较平衡。
fairytale
69 天前
@Keuin 备份读的少,加上 Linux 缓存,理论上目录结构不会丢,文件撞到坏道几率小一些,能拷出来。重建不管文件系统全盘重建,。
fairytale
69 天前
还有个问题,服务器上没插空的后备盘么?比如大半夜 raid5 掉一块,后备盘会自动顶上去的。
drymonfidelia
69 天前
@fairytale 以前可能有,运维离职了,服务器相当长时间没人管,备用的盘也全拿来存数据了,今天出问题的时候阵列空间占用已经超过 90%了
nkcfc
69 天前
见过两次 raid5 掉以后就只用 raid6 和 zfs 阵列了。
i1MqODKe0P16t1Ra
69 天前
先备份。再重建。
defunct9
69 天前
实战过很多次了,都是直接拔了换新盘。当然,大前提是每天都用脚本扫服务器,一坏马上更换。
lm902
68 天前
首先,把数据全部备份出来,能救多少是多少。
第二,下个阵列用 RAID 6 。
最后,RAID 不是备份,要拥有并及时更新备份。
vipviphaha
68 天前
raid 5 是否有 hot spare ,有了,就先备份数据吧,完了,买快新盘插上,阵列管理里面操作。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1057008

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX