V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
swananan
V2EX  ›  程序员

线上故障应急处理: 4 年多 on call 经验总结

  •  7
     
  •   swananan ·
    swananan · 157 天前 · 13421 次点击
    这是一个创建于 157 天前的主题,其中的信息可能已经有所发展或是发生改变。

    https://jt26wzz.com/posts/0007-online-firefighting-real-world-lessions-from-4-years-on-call/

    最近写了一篇回忆过去故障应急的博客,写的还是挺开心的,发现自己博客没有被收录在 VXNA 节点,就自己在这里发出来,交流交流。已经尽力隐藏了很多公司相关的细节,希望不要被熟人看见,有点羞耻,哈哈。

    第 1 条附言  ·  131 天前
    推荐下我一个开源项目: https://github.com/swananan/feather-quic 求交流
    106 条回复    2025-05-14 16:12:18 +08:00
    1  2  
    gezilzq
        101
    gezilzq  
       147 天前
    写的太好了,学到了很多
    littleqiu0517
        102
    littleqiu0517  
       145 天前
    感谢分享,写的真好,有好多的共鸣👍
    jingzhou
        103
    jingzhou  
       145 天前
    @wuyiccc 我理解新功能也可以加上开关,开关放到配置中心,如果新功能有问题,直接关掉,毕竟服务回滚也需要一定时间
    littlecreek
        104
    littlecreek  
       145 天前
    @kuanat "我的建议是负责人要勇于承担责任" 这种需要老板非常明确的传达给团队, 甚至可以效法商鞅变法的套路, 适当奖励/表扬用于承担责任不甩锅的员工. 这样员工才能放心大胆的承担责任. 老板态度不明确不坚决, 谁敢堵上自己的职业生涯去主动接锅? 既然大多数人甩锅是常态, 说明整个氛围就是这样的.
    Leeeeex
        105
    Leeeeex  
    PRO
       136 天前
    写的很好,学到了很多东西,👍
    hawken
        106
    hawken  
       131 天前
    花好几天看完了😏,感觉非常不错,写得很通顺
    1  2  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   956 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 22:06 · PVG 06:06 · LAX 15:06 · JFK 18:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.