@
xgfan 这个视频槽点很多
1. ECC 纠错计数不一定报告,需要主板 BIOS 系统同时支持。比如 AMD 桌面 CPU 就是支持 ECC 但不报告。所以错误报告并不是好证据。还有用云服做证据的,底层有错误不一定报告给虚拟机啊。
2. ECC 不是用来挽救坏掉的内存的。虽然一些平台提供了单颗粒失效时屏蔽该颗粒,降级代用的功能,但是实际上需要特定硬件,比较难配齐。
3. 想想为什么 DDR5 需要在颗粒里使用片上纠错,就是因为容量大密度高以后,单个比特的体积太小,位反转更加容易了。
他视频里这点数据量不代表什么,,我自己就经历过 PCIE 设备( HBA )坏了,linux 日志里报内存错误的。神奇的是居然还能跑。
4. 我就是在云厂商工作的,内存错误当然是有监控的。ECC 错误我见得多了。
5. 另一个观点是如果内存坏了,系统早崩了。这话是没错,但是系统先崩还是你数据先坏,你想赌一把吗?
6. 另一个案例里,他说一个月“才”一次。一个月一次已经很多了好吗。你的 nas 要是想长期保存,定期 resilver 。resilver 一次坏一点点,这谁受得了? resiliver 期间的内存错误不一定能被程序逻辑修复,反而可能往错误的方向越修越坏。
7. 评论区其实就有很多人持反对意见,也有很多案例,你可以往下翻翻
当然,你说你数据不重要,反正还有其他备份。那是你的选择,没问题。
但是,既然洋垃圾平台本来就便宜,Reg ECC 内存更便宜,那何必呢?为了多花几百块钱?为了省几十块电费?就为了赌内存不出错?
如果你是为了新硬件的性能,那参考我前一条回复,nas 和需要性能的应用服务不应该 all in one 。