腾讯云的事,是不是很多人以为三副本就是备份,不应该丢数据,很靠谱....

2018-08-06 21:12:27 +08:00
 void1900

希望这些人不是后端或运维…

三副本都是同步的,一般只能避免磁盘损坏问题…

并不是你们以为的备份功能…


阿里云有云盘三副本的技术介绍

https://www.alibabacloud.com/help/zh/doc-detail/35108.htm

如果你还要咬着不放,我希望你转前端、客户端 ^_^

19628 次点击
所在节点    程序员
151 条回复
void1900
2018-08-06 23:35:32 +08:00
@mhycy 不扯了难多的技术细节太说不准了

我希望的是大家正视数据丢失问题,无论哪家云的云盘技术方案都没和你说过保证数据 100%可靠。

即使你自己再做跨地域同步+跨地域备份也只是提高了可靠性。 同样给不了你 100%可靠。这应该是程序员还有的严谨!
void1900
2018-08-06 23:37:02 +08:00
@1762628386 希望你别耽误了你们公司价值千万的数据
mhycy
2018-08-06 23:37:42 +08:00
@void1900
硬件 RAID 最基础最基础的低成本高可靠选项是 RAID6,不是 RAID5

RAID1 的存储成本过高
RAID5 存在两个磁盘损坏无法修复的可能性
RAID10 存在特定两个磁盘损坏后无法修复的问题(除非其中的 1 不止一个磁盘)
RAID50 存在特定两个磁盘损坏后无法修复的问题
RAID60 存在特定三块磁盘损坏后无法修复的问题

假设现在情况真的是磁盘回报异常,那么算是静默错误,当成磁盘写入全 0 好了
且故障真的是固件 BUG 引发,那么非同固件且非同批次磁盘构建阵列这个准则是否已经违反?

所以说在正确构建阵列的情况下这是概率极低的事件
除非。。。阵列卡出 BUG 了
1762628386
2018-08-06 23:40:40 +08:00
@void1900 这次有功 腾讯年终奖给你加不少吧
void1900
2018-08-06 23:41:12 +08:00
@mhycy 那我问你个数字 ,可靠性多少%?
void1900
2018-08-06 23:42:04 +08:00
@1762628386 我不在腾讯 喷子🙂
mhycy
2018-08-06 23:42:22 +08:00
@void1900
给个场景?
void1900
2018-08-06 23:44:16 +08:00
@mhycy 就按你最高的可靠标准来构建这个阵列
void1900
2018-08-06 23:50:15 +08:00
@mhycy 在简单点 就是腾讯云给出的这个故障原因 单个磁盘 固件 bug 读写不一致 的静默错误

你能保证数据 100%在?
mhycy
2018-08-06 23:54:26 +08:00
@void1900
按照准则这个故障原因是日常不是异常
zhang61go
2018-08-06 23:54:35 +08:00
值不值一千万,web archive 看看就知道。
明明有定时快照,却把存系统盘的所有数据保持两年不做快照。
CVM 本质上就是一个 VPS,不用云数据库之类的服务算节省成本勉强认可,但是你不懂基础设施执行定时备份,赖平台这面出现的意外,恕我直言,腾讯云赔 13 万都贵了。
misaka19000
2018-08-06 23:58:36 +08:00
> 如果你还要咬着不放,我希望你转前端、客户端 ^_^

感觉到了楼主满满的后端优越感啊,我想请问你有什么值得优越的?
void1900
2018-08-07 00:01:18 +08:00
@mhycy
算不算异常太多技术细节不透明了,主要很多人认知的三副本就是三个备份,但在磁盘阵列里有很多的机制去判断和同步,没人能保证 100%不出问题。

就问你能向你的客户保证不丢数据吗?你敢建议他们不另做备份吗?
void1900
2018-08-07 00:02:32 +08:00
@misaka19000 没有优越 只是希望那些不理性的喷子别耽误了他们公司价值千万的数据
mhycy
2018-08-07 00:08:18 +08:00
@void1900
搞不懂你是在杠还是在讨论问题
本来我觉得你在贴头说的话还挺有理的
然后在回复这个帖子前重新看了回复对了下 id
现在我都不知道该怎么和你聊下去了

理性讨论问题是基本的礼貌与对别人的尊重且对双方的技术提升都能有所帮助,希望你懂这个道理。
jadec0der
2018-08-07 00:10:46 +08:00
@void1900 那我把最后一个损坏改成丢数据吧,还是那个问题,你咋知道这么多腾讯云没公布的信息?
void1900
2018-08-07 00:15:38 +08:00
@mhycy 没有抬杠 ...

我只是想说无论怎样,各家云的技术方案都不可能 100%可靠

至于技术,因为里面很多细节没公开,靠猜没太多讨论价值
void1900
2018-08-07 00:16:18 +08:00
@jadec0der 我哪里知道细节了……?

都是官方的公告里的
n2ex2
2018-08-07 00:20:52 +08:00
看不懂这么多人在争什么,不管腾讯声称几个 9,几个备份,它已经承认是自己的问题了,那就按照赔偿条款来做。
ryd994
2018-08-07 00:23:22 +08:00
关于为什么一块硬盘固件错误会影响三块,可能是这样的:
假设某硬盘固件有误,写入数据的一半全是 0
这时候阵列还是在线的,因为没人知道这块硬盘是错的
我们继续使用,刚好文件系统要用到这些数据,于是读取这一段
阵列卡依然不知道有问题,于是就挑了这块坏的数据
文件系统遇到一两个错误,未必就会立刻崩溃,于是数据修改后又写回去了,注意此时所有副本都已经丢失,如果用户数据也在这一段,那数据已经丢失
最后终于,某个系统文件出错,系统崩溃,这时候文件系统已经不成样子了,就算成样子,数据也已经没了

raid 不保数据不一致。raid 的前提假设就是如果硬盘挂了,就会瞬间彻底离线。这也是为什么某些硬盘有读取超时时直接报错,为的就是提前通知 raid 控制器,防止阻塞整个阵列。

raid 只保 uptime,不保数据可靠性,这必须牢记。


@mhycy
@jadec0der
@type

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/477408

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX