B 站的事故报告啥时候才出来?

2021-07-15 11:32:43 +08:00
 godblessumilk
本吃瓜群众想围观甩锅,顺便学习下高可用架构。说是机房故障未免太笼统。。硬件故障?员工误操作?
10968 次点击
所在节点    全球工单系统
74 条回复
fetich
2021-07-15 15:03:16 +08:00
@delectate 这方面不得不点名表扬 Cloudflare
wateryessence
2021-07-15 15:07:44 +08:00
@fetich 确实,上课的时候直接拿 cloudflare 的报告做案例研究
fetich
2021-07-15 15:10:56 +08:00
@delectate 那啥,我在某处看到了同样的用户名和头像,只不过 d 是大写的,不确定是不是本人。提个建议,多平台不要使用雷同的帐号和头像,不安全。
EastLord
2021-07-15 15:13:12 +08:00
敖丙帮你分析了事故原因 https://juejin.cn/post/6984577649968414757
KouShuiYu
2021-07-15 15:15:07 +08:00
楼上让人感动的大飞机让我想起了波音 737
3dwelcome
2021-07-15 15:26:27 +08:00
@otakustay "A 站的问题确实是一个 DDOS,但不是 B 发起的,纯粹用户突然增长变成了服务拒绝而已"

我个人觉得这种几率很低,DDOS 是放到 5 年前是事故主因我信,现在 A 站都是放阿里云,云又不可能被轻易打挂。

而且豆瓣又不是视频站点,不太可能同一时间被 DDOS 了。

PS: 刚才去又看了一眼 A 站网页,竟然上了 Service Worker,前端技术比 B 站还先进。也许就是这个 SW,让我误以为那天 HTML 没挂。
godblessumilk
2021-07-15 15:27:36 +08:00
@wph95 具体故障原因公众号推文有截图吗,跪求。。我推测的故障原因是三者其一 ① 阿里云防火墙在部署升级,防火墙配置不当,拖垮了 B 和 A ② 阿 B 的软件层的高可用架构并未考虑极端情况,导致了机房硬件的过热,单节点硬件故障,后续雪崩引起大片服务宕机 ③ 中间件 tengine 升级,未全面测试,导致线上生产环境 5XX 故障
wph95
2021-07-15 15:30:56 +08:00
@godblessumilk #27
3 接近
不过锅不在 tengine,某个东西升级后 luajit bug 了 =。= (当下谜语人懂得都懂
发文章的人都快收拾工位了就不放截图了 =。=
3dwelcome
2021-07-15 15:31:50 +08:00
@EastLord 赌一包方便面,不是技术人员的锅。
damnu
2021-07-15 15:33:00 +08:00
这也能联动到攻击国人身上了?
meteor957
2021-07-15 15:33:40 +08:00
who cares
wph95
2021-07-15 15:33:54 +08:00
@delectate #14
有道理是有点道理
但是拿 toB 公司和 toC 公司比没啥意义 toC 公司公开事故报告有啥意义 你爸妈 or 行外人就看个热闹瞎起哄
toB 公司不公开,出事故出了多次就丧失信任就跑路了
godblessumilk
2021-07-15 15:36:51 +08:00
@wph95 求加微信细说,T29wc180MDNGb3JiaWRkZW4=,加密方式懂的都懂
godblessumilk
2021-07-15 15:54:51 +08:00
@wph95 #32
是这篇博文提及的 bug 吗???

每个线程开启一个 LuaJIT 虚拟机( LuaJIT 2.1.0-beta3 )在高并发情况下,lua 代码会出现诡异情况。当 xxx 为 1 时,按理应该 xxx ~= 1 为 false,但是很奇怪的是反而为 true 。只有 not xxx == 1 才为 false,ps.暂时无法用独立的测试用例来重现此问题。

https://www.cnblogs.com/lcinx/p/13564598.html
windyskr
2021-07-15 16:33:25 +08:00
一包辣条猜是墙的某一组件爆炸了。
otakustay
2021-07-15 16:57:46 +08:00
@3dwelcome 云不代表自动扩容,或者说现在大部分企业用云根本没有自动扩缩容能力。你说数据库、CDN 不会被打挂这个很合理,但核心的业务服务买虚拟机部署是很容易就会挂的
yikyo
2021-07-15 17:10:57 +08:00
@delectate 博客园的还是算了吧,一年能有十几次,拿线上环境当练手了。。
A555
2021-07-15 17:21:22 +08:00
@3dwelcome #26 A 被快手重构过了吧
xrr2016
2021-07-15 18:19:43 +08:00
@delectate 不是吧,拿部电影来贬低国内,太廉价了...
zhoudaiyu
2021-07-15 22:25:54 +08:00
@wateryessence 求事故报告的链接

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/789662

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX