网易云官方回复说因为业务扩容出现了技术事故,好奇仅仅扩容怎么造成这么大范围事故的,主站都寄了

125 天前
 tmtstudio

7971 次点击
所在节点    程序员
31 条回复
NevadaLi
124 天前
@zdkk #17 凌晨要睡觉、、
810244966
124 天前
之前在掘金看到说网易云音乐整体搬迁到贵州去,不知道是不是这个过程中出现的偏差 https://juejin.cn/post/7389952004791894016
holyliao
124 天前
@zdkk 网抑云晚上可是使用高峰
Emiya1208
124 天前
没什么不可能的,扩容又没指定怎么扩容,auth 或是 很基础的服务,跨区扩容就要涉及网络变动,网络变动嘛,一条错误的路由就能干废整个集群,甚至要是有人写错了 ip 地址冲突了,直接能让某些正常服务跟着一块儿挂掉。
kneo
124 天前
@Emiya1208 哈哈,那些动不动就说“不可能”的,干活是最不靠谱的,大坑一般都是这种人搞出来的。
Jinnrry
124 天前
@Emiya1208 写错一条 ip 地址,干废整个集群这事我干过。当年直接让全公司所有业务挂了几分钟,还好我回滚及时。不过刚好是下班时间,全公司研发都回来看了一个小时监控
iovekkk
124 天前
昨天有一个内部员工的聊天记录传了出来(不知道真假),说的是大幅裁员导致云储存部门就剩一个人了,然后那个人按着交接文档操作,然后操作出了这个事故出来
tinycold
124 天前
@iovekkk 好了,现在一个人也剩不了了。/doge
Emiya1208
124 天前
@iovekkk 剩一个人是有可能的 @tinycold 但是只要不是这个人故意搞的事儿,他是不会被裁的,甚至他想走都走不了的。
Emiya1208
124 天前
@Jinnrry 正常,我也不小心把 long 写成 nong 过,搞了几分钟故障。不过我发现的比较快,而且相关服务不是基础性的,只是上层的。
brom111
124 天前
@iovekkk 主要是昨天那个页面看起来 不像是云存储部门有问题吗。 前面入口层面也没做什么紧急处理的样子。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1066284

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX