折腾 NAS 丢失大量珍贵数据后有感

2020-08-20 11:45:36 +08:00
 hotsun168

背景

  1. 第一版 NAS 已用 5 年,为占美无风扇工控机、一块 WD60EFRX 、优越者 Y-3359R 进行 DIY,稳定时千兆可跑满。

  2. 为了顺便当做远程桌面,没有使用黑群晖或 Linux,使用了 Win7 系统。Samba 服务经常无故卡死,遇到网络无法连接、0x00000000XX 等类似错误或“服务器存储空间不足无法处理此命令”等错误无数次,每次基本都需要重启。花了无数时间来解决这些问题,无果。一直在忍受,后续甚至写了脚本做定时重启。

  3. 第二版(在用)为群晖 DS920+、一块 WD140EMFZ,以及上面的 6T,买之前提前了解了很久 RAID5 是否安全,后选择 SHR 。

灾难

  1. 因计划把 6T 和 14T 硬盘都放入群晖,但硬盘插入群晖会被格式化,所以 14T 硬盘到货当天,用外接硬盘座接入 14T 硬盘,在 Win7 下进行 6T 到 14T 文件全量复制,期间报错无数,推测可能是 6T 磁盘长时间运行导致文件分配表错误。搜索相关资料提示 chkdsk 修复 NTFS 分区。

  2. [重点] chkdsk 完毕后,6T 硬盘中大量资料丢失(超过 80%),其中包括各种重要文件,尝试 DiskGenius 修复未果(不光是无法找回文件分配表,而且连 RAW 数据都无法找回)。

  3. 不幸中的万幸,其中少部分文件在各个网盘有备份,另一部分几年前有刻盘备份,但其中一些珍贵的资料再也无法找回(包括结婚视频、小孩照片、老光盘 ISO 等个人产生文件,与老游戏、各种收藏的视频等网络下载资源)。

  4. 花费几天时间在各种平台搜索网络下载资源,因年份久远,几乎全部失效,近似于无法找回。

现状与未来

  1. 计划在过一段时间之后再买一块 14T,尽可能避开同批次,2 块盘开 SHR 。

  2. 每隔一段时间继续买 14T,加到 4 块,开 SHR2 。

教训与体会

  1. 任何情况下大量数据复制尽可能先备份,或者使用专门的工具进行,谨慎进行 chkdsk 等硬盘修复措施。不要因为是程序员身份就各种放心大胆地操作,稍有不慎就会产生非常严重的后果。

  2. 脑子要清楚,选择方案要合理可行。其实可以选择先把 6T 使用 Ghost 备份一份到 14T 硬盘,再进行数据复制,反正空间足够。

  3. 重要资料放在 NAS 一定要开 RAID,硬盘少就用 RAID1,硬盘多可考虑 RAID5 、RAID6 或者群晖的 SHR 或 SHR2,其中尽可能选择允许 2 块盘故障时可恢复的方案。同时使用多份备份,网盘、冷备、刻盘等。

  4. 网络下载资料可考虑使用脚本生成 ed2k 链接,文件丢失后可以重新下载,或使用网盘快速离线。

  5. 从 2015 年第一版 NAS 到今年买群晖中间的 5 年里,硬盘柜里一直只有一块硬盘,最开始选择的 5 盘位硬盘柜产生了严重的浪费。感慨自己想得太多,有美好的愿望但却一直没有落实,又感叹运气太好,这 5 年中唯一的一块硬盘居然没坏。

  6. 第一版 NAS 使用的这 5 年中,是人生大事接连不断的几年,根本存不下钱,更别提这种大额投入了。所以钱真的可以解决绝大部分问题。如果有钱,最开始我就买群晖并放满硬盘,开各种灾备,就可以避免这种大量数据搬运,数据丢失的概率会大大降低。

  7. 只有栽跟头才能让人积累经验,只有疼痛才能让记忆更深。不舍得投入成本保护数据,还是因为数据对你不够重要。

38259 次点击
所在节点    程序员
154 条回复
Osk
2020-08-20 12:56:24 +08:00
楼主第一个 nas,估计没定期监视硬盘 s.mart, 没定期 fsck,其实数据在之前可能已经出错了,只是没发现
Osk
2020-08-20 12:57:10 +08:00
c.h.k.d.s.k 为啥会触发关键词????
CismonX
2020-08-20 12:57:30 +08:00
你说的这些珍贵资料,我都是走蓝光冷备然后压箱底的。毕竟这辈子可能都不会再打开看一次,但如果真的想看却丢失了就很难受
mosfet
2020-08-20 13:07:59 +08:00
重要的再冷备份一份吧
或者同步网盘上去
terrancesiu
2020-08-20 13:12:51 +08:00
我自己创造的数据,如文档、图片、视频等我基本都直接上传到 Google One,目前 200G 够用,但是每年我会下载回本地 2 次归档。而归档盘我使用了希捷的叠瓦盘,一共 2 块,每次归档完成后就放硬盘箱里保存。目前我在考虑做第三份副本。不是我自己的数据,我基本放 gsuite 了,gsuite 来源是各种 edu 嫖来的,翻车机率高,但是我基本在 n 个 gsuite 之间做同步,每天都做。所有的操作只使用了 rclone 。目前暂时未出现问题。工作用内容目前还是 Dropbox 免费的 20g,足够用了。
Tyuans
2020-08-20 13:26:23 +08:00
你再查查,会发现群晖的 raid 也不安全,尤其是 TB 级数太高,恢复起来会很麻烦,甚至很多都无法恢复。

最好的方法还是多地方备份,分开存储,我的群晖里都是 basic,没有 raid 。照片视频重要性最高的,多地方手动备份,自动备份,都用上。收藏电影游戏那些,不行就刻盘,但是刻完盘后会发现其实很多自己都不会再看再用第二次,跟照片那些一起备份起来也都是浪费空间。
whatv3
2020-08-20 13:37:29 +08:00
我的做法是 NAS + 云盘 ...
qiaobeier
2020-08-20 13:39:07 +08:00
我也碰到过一次 NAS 硬盘突然损坏的事故。
幸好项目代码等等有各种 git 服务器,照片及重要数据有本机(各种 PC,MAC,Phone )+云,最后就是损失了电影音乐及各种设备的定期备份,所以算是没损失。

但还是有一点后怕。 现在买了银河企业硬盘,不知道是不是好一点。
crazycarry
2020-08-20 13:40:20 +08:00
多年的种子没有了吧
henyi2211
2020-08-20 13:43:02 +08:00
没用 raid, 我上了 unraid 系统, 挺顺心的
winterx
2020-08-20 13:45:51 +08:00
个人观点:
不嫌占用地方,光驱绝对是最好的存储介质。
有钱买磁带机,没钱买移动硬盘。

准备入手几个移动硬盘做冷备份,只在备份时通电。
hotsun168
2020-08-20 13:48:13 +08:00
@wenwen226400 官方客服回复,群晖硬件损坏,同型号的机器把硬盘按原位插回去直接可用。
@Tyuans 等第二块 14T 到了,我考虑要不要改成 RAID1 。冷备也在考虑,集中花钱比较压力大,下个月吧。
hotsun168
2020-08-20 13:54:28 +08:00
@Osk 可能是早就出错了,确实长时间插着没有管过。
@CismonX 我是个怀旧的人,说不定会时常拿出来看看。只不过现在没机会了。
@qiaobeier 企业级开销目前还无法承受,毕竟家庭小孩无时无刻不需要用钱,先考虑冷备吧。
@crazycarry 种子真的无所谓,认真找还是能找到的。
@henyi2211 看了一下,确实是个好系统,有空研究一下。感谢分享。
@winterx 准备上蓝光做冷备了。
techotaku2233
2020-08-20 14:00:04 +08:00
@hotsun168 我觉得 RAID1 不理想,首先并不是有那么多重要的数据都需要备份,RAID1 严重浪费空间。其次 RAID1 无法解决极端情况的数据丢失,如遭贼,火灾,等等天灾人货。还是需要一份异地备份,网盘也好,蓝光冷备也好。
Tyuans
2020-08-20 14:05:51 +08:00
@hotsun168 #32 我群晖里占地大的是下载的电影,个人资料少,每次用 hyperbackup 运行之后再考出来都行。我建议是把数据分等级备份,会轻松。
superszy
2020-08-20 14:11:01 +08:00
虽然都说 raid5 不安全,但是我在 4T 红盘 x 4 组成的 raid5 中,坏了一块硬盘后,还是保住了所有数据(没敢重建 raid,而是直接备份出来的)。
sarices
2020-08-20 14:24:55 +08:00
多重备份才是王道,重要数据我都一份 nas,一份网盘,一份冷备份
otakustay
2020-08-20 14:36:28 +08:00
我 RAID 的 NAS,一块硬盘坏了换新的,RAID 重建的时候第二块当场坏掉数据丢了
后来想了想也对,同一时间买的同品牌型号硬盘,同样的写入量,寿命本来就差不多,要死一起死,RAID 个毛线
zjsxwc
2020-08-20 14:38:15 +08:00
@otakustay 所以买不同品牌的 raid 硬盘?
matolv
2020-08-20 14:39:03 +08:00
要安全就前后端,软硬件都做到位。
硬件自己买,i3 9100/r3 3100+16G ecc 内存+可以 headless 主板。
操作系统用 debian/centos 。
文件系统用 zfs raid10 或 3 盘 raid50 的方案。
维护一月一次的 scrub,200 小时一次 smart 短测,5000 小时一次 smart 长测。
重要数据半年一次增量备份,你基本就万无一失了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/699891

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX