折腾 NAS 丢失大量珍贵数据后有感

2020-08-20 11:45:36 +08:00
 hotsun168

背景

  1. 第一版 NAS 已用 5 年,为占美无风扇工控机、一块 WD60EFRX 、优越者 Y-3359R 进行 DIY,稳定时千兆可跑满。

  2. 为了顺便当做远程桌面,没有使用黑群晖或 Linux,使用了 Win7 系统。Samba 服务经常无故卡死,遇到网络无法连接、0x00000000XX 等类似错误或“服务器存储空间不足无法处理此命令”等错误无数次,每次基本都需要重启。花了无数时间来解决这些问题,无果。一直在忍受,后续甚至写了脚本做定时重启。

  3. 第二版(在用)为群晖 DS920+、一块 WD140EMFZ,以及上面的 6T,买之前提前了解了很久 RAID5 是否安全,后选择 SHR 。

灾难

  1. 因计划把 6T 和 14T 硬盘都放入群晖,但硬盘插入群晖会被格式化,所以 14T 硬盘到货当天,用外接硬盘座接入 14T 硬盘,在 Win7 下进行 6T 到 14T 文件全量复制,期间报错无数,推测可能是 6T 磁盘长时间运行导致文件分配表错误。搜索相关资料提示 chkdsk 修复 NTFS 分区。

  2. [重点] chkdsk 完毕后,6T 硬盘中大量资料丢失(超过 80%),其中包括各种重要文件,尝试 DiskGenius 修复未果(不光是无法找回文件分配表,而且连 RAW 数据都无法找回)。

  3. 不幸中的万幸,其中少部分文件在各个网盘有备份,另一部分几年前有刻盘备份,但其中一些珍贵的资料再也无法找回(包括结婚视频、小孩照片、老光盘 ISO 等个人产生文件,与老游戏、各种收藏的视频等网络下载资源)。

  4. 花费几天时间在各种平台搜索网络下载资源,因年份久远,几乎全部失效,近似于无法找回。

现状与未来

  1. 计划在过一段时间之后再买一块 14T,尽可能避开同批次,2 块盘开 SHR 。

  2. 每隔一段时间继续买 14T,加到 4 块,开 SHR2 。

教训与体会

  1. 任何情况下大量数据复制尽可能先备份,或者使用专门的工具进行,谨慎进行 chkdsk 等硬盘修复措施。不要因为是程序员身份就各种放心大胆地操作,稍有不慎就会产生非常严重的后果。

  2. 脑子要清楚,选择方案要合理可行。其实可以选择先把 6T 使用 Ghost 备份一份到 14T 硬盘,再进行数据复制,反正空间足够。

  3. 重要资料放在 NAS 一定要开 RAID,硬盘少就用 RAID1,硬盘多可考虑 RAID5 、RAID6 或者群晖的 SHR 或 SHR2,其中尽可能选择允许 2 块盘故障时可恢复的方案。同时使用多份备份,网盘、冷备、刻盘等。

  4. 网络下载资料可考虑使用脚本生成 ed2k 链接,文件丢失后可以重新下载,或使用网盘快速离线。

  5. 从 2015 年第一版 NAS 到今年买群晖中间的 5 年里,硬盘柜里一直只有一块硬盘,最开始选择的 5 盘位硬盘柜产生了严重的浪费。感慨自己想得太多,有美好的愿望但却一直没有落实,又感叹运气太好,这 5 年中唯一的一块硬盘居然没坏。

  6. 第一版 NAS 使用的这 5 年中,是人生大事接连不断的几年,根本存不下钱,更别提这种大额投入了。所以钱真的可以解决绝大部分问题。如果有钱,最开始我就买群晖并放满硬盘,开各种灾备,就可以避免这种大量数据搬运,数据丢失的概率会大大降低。

  7. 只有栽跟头才能让人积累经验,只有疼痛才能让记忆更深。不舍得投入成本保护数据,还是因为数据对你不够重要。

38256 次点击
所在节点    程序员
154 条回复
wandehul
2020-08-20 11:50:37 +08:00
重要数据多备
manzhiyong
2020-08-20 11:54:28 +08:00
工控机重启那种大概率是过热造成的,你查下温度,硬盘温度大于 40 度就是太热了。可以换专门的 nas 机箱,我原来一般 pc 机箱,各种死机蓝屏坏内存条,换了银欣 nas 机箱后就屁事没有了,安逸的很。
XDash
2020-08-20 11:55:07 +08:00
现在都是重要数据 NAS + GDrive 双重备份,文档代码还同时提交到 Github,照片 Google Photos 同步一份
lshero
2020-08-20 12:01:38 +08:00
用 NAS 的自动同步备份一份到 backblaze 或者 wasabi 上面吧,这两个性价比高一些。
zjsxwc
2020-08-20 12:08:31 +08:00
楼主,我无脑 raid1 可以吗? 我对数据都在同一目录的需求不大,比如 6 块 8T 硬盘,我做 raid1 是不是 可以获得 3 个 8T 的存储空间?
anubu
2020-08-20 12:14:14 +08:00
个人用户优先考虑多点备份或者离线备份,建立合理的备份分级和管理体系。RAID 主要用于高可用场景,对个人用户来说优先级不太高,甚至不需要。当然,非要把高可用和容灾混用也不是不行。
Smash
2020-08-20 12:17:05 +08:00
我的是 DS1019+,外接了一个威马硬盘盒两块 2T 共 4T 硬盘做备份,然后再 HyperBackup 在京东云做备份。
shellus
2020-08-20 12:23:18 +08:00
我把我的西数 8T 从硬盘盒拿出来放到 nas 里的 ubuntu 里面,发现 ntfs 格式 cpu 占用高,于是找了个无损转换 ntfs 到 ext4 的工具,转换时间预计一周,结果转完数据丢了,也是一样用 DiskGenius 数据恢复失败,能看见文件名,恢复出来都是打不开的文件, 和楼主一样,丢了旅游照,结婚照,小孩照片,伤心死了
Kiriya
2020-08-20 12:29:12 +08:00
重要数据比如照片视频还是要冷备份,建议用 1T 以下的 CMR 硬盘备份并断电存放
jsnjfz
2020-08-20 12:31:12 +08:00
普通硬盘非企业用尽量别 RAID5,我觉得无脑 RAID1 就挺好
wenwen226400
2020-08-20 12:31:16 +08:00
raid 不是备份,那些连 journal 都没有的 raid 更加别用了 还有团灭风险
群晖 你硬件坏了 更难修 还不如 windows 呢
windows 可以用 snapraid
能扔到 google photo 的 就扔啊
电源要买 10 年保质期,1 元 1 瓦的
硬盘座 都是坑
mpz7
2020-08-20 12:39:23 +08:00
不说别的,照片都不洗出来吗?
wazon
2020-08-20 12:41:23 +08:00
不一定是 chkdsk 损坏的吧?
a1044634486
2020-08-20 12:43:33 +08:00
6t 复制到 14t,复制完之后被复制的 6t 硬盘资料丢失,太吓人了
waruqi
2020-08-20 12:46:16 +08:00
我是定期刻光盘
imn1
2020-08-20 12:47:07 +08:00
60T 无 NAS 路过,就一个四位无 raid 硬盘箱
LokiSharp
2020-08-20 12:47:31 +08:00
我买的 HGST 企业盘也只敢 RAID1...
love
2020-08-20 12:51:19 +08:00
我没用 nas,而是买了一堆移动硬盘,因为我不需随时访问资料,要用的时候接上就行。离线放置硬盘相当耐用,从 10 年前买到现在一块都没坏。
hotsun168
2020-08-20 12:55:20 +08:00
@manzhiyong 工控机温度和硬盘温度没关系,硬盘是放在硬盘柜的。
@zjsxwc RAID1 当然可以,我考虑 SHR 是为了更充分利用磁盘空间。
@anubu 有很多人觉得 RAID 对个人用户没用,所以我也没有过多的去思考,就这么做了。
@shellus 只有丢失过这种超级珍贵的数据,才能对数据的安全性有更深刻的认识。
@wenwen226400 群晖硬件损坏我还真没考虑过,我去官网咨询一下。
@mpz7 照片数量很多,全都洗出来不可能,而且纸质会丢失像素细节吧。
@wazon chkdsk 前文件可读,只是拷贝出错,chkdsk 后文件丢失。所以我判断 chkdsk 有问题。
@waruqi 也打算这么做了,目前看好的是威宝千年光盘。
Osk
2020-08-20 12:55:48 +08:00
重要的东西:
在线:raid1 + 定期 scrub + 文件内容 crc,都由文件系统和其下的存储池管理层完成。
离线:本地离线备份,网盘加密备份。

不重要的东西:无 raid,scrub + crc 要不要都不影响。

下载的电影啥的:raid0 走起,大不了挂了重下。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/699891

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX