大家在线上遇到故障是如何处理的?

2016-09-27 21:35:31 +08:00
 tanteng

对于大公司的项目,往往用户规模很大,并发量也很高,如果线上出现故障需要及时进行修复,这对程序员的随机应变能力,和综合能力是个考验,大家能否讲讲在线上遇到过哪些故障,而又如何快速定位问题并解决的呢?传授一下方法。

不限语言(PHP,JAVA,C#,Node.js,Python),只要是 WEB 项目,大家来聊聊,分享一下自己的经验。

2375 次点击
所在节点    PHP
3 条回复
pc10201
2016-09-27 22:23:20 +08:00
试一下 sentry
JamesPan
2016-09-28 00:03:22 +08:00
先止血,后分析原因。

如果是发布过程中出问题,就回滚;如果是个别机器出问题,就把出问题的机器从负载均衡上摘掉。

做变更前准备好回滚措施。
superbear
2016-09-28 13:16:48 +08:00
步骤:恢复服务,保留现场,排查问题和验证

具体可看大神博文 http://www.bo56.com/%E7%BA%BF%E4%B8%8Aphp%E9%97%AE%E9%A2%98%E6%8E%92%E6%9F%A5%E6%80%9D%E8%B7%AF%E4%B8%8E%E5%AE%9E%E8%B7%B5/

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/309386

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX