好奇有多少公司是支持机房/AZ 级容灾的?

241 天前
 superhxnju
在这个帖子里面看到有讨论多副本支持 AZ 容灾的事情 https://www.v2ex.com/t/1021131

好奇有多少公司是支持“真”机房/AZ 级容灾的?

个人理解如果是真正的实现容灾那么至上而下要能容灾:
1. 首先业务和基础设置部署上需要多 AZ 部署;
2. 然后在线业务依赖的数据库、带存储类的中间件(消息、缓存)需要有 AZ 容灾能力(如果只是切流,那不算“真“容灾,数据也需要保证完整性的);
3. 还有离线大数据的批处理等也要跨 AZ 部署;
4. 最后还要能监测到 AZ 故障,整体南北流量进行切流;

感觉还是挺难的,所以大家的 AZ 级容灾是咋做的,真的可以把一个 AZ 永久性的灾难,然后业务可用性和数据也不受损么?
710 次点击
所在节点    问与答
3 条回复
egen
241 天前
没那么容易做的,参考当年的支付宝机房光纤被挖断导致业务中断事件
killva4624
241 天前
大部分逻辑组件或者边缘接入都是很好做到 AZ or 机房容灾的。
真正难的是核心数据层,又要考虑数据一致性,又要考虑迁移成本和速度;还有日常演习的难度,不可能做到和逻辑层同样的容灾能力和 MTTR ,无非是在衡量成本、人力和可执行层面上综合评估,做一个平衡的方案。
当然金融类平台也许真的有那么大的成本和精力投入去做,希望其他朋友能给出好的例子。
superhxnju
241 天前
@killva4624 是的,数据层跨 AZ 复制后延时至少再增加 1 ms ,不知道各个业务会为了 AZ 容灾付出多大的代价。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1021215

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX