对于大公司的项目,往往用户规模很大,并发量也很高,如果线上出现故障需要及时进行修复,这对程序员的随机应变能力,和综合能力是个考验,大家能否讲讲在线上遇到过哪些故障,而又如何快速定位问题并解决的呢?传授一下方法。
不限语言(PHP,JAVA,C#,Node.js,Python),只要是 WEB 项目,大家来聊聊,分享一下自己的经验。
1
pc10201 2016-09-27 22:23:20 +08:00
试一下 sentry
|
2
JamesPan 2016-09-28 00:03:22 +08:00 1
先止血,后分析原因。
如果是发布过程中出问题,就回滚;如果是个别机器出问题,就把出问题的机器从负载均衡上摘掉。 做变更前准备好回滚措施。 |
3
superbear 2016-09-28 13:16:48 +08:00 1
|