我还有救吗,求支招

2019-03-02 00:29:41 +08:00
 NoString

十天之前做产品的一个微需求 测试也通过 上线后一直运行无人爆出问题 直到今天偶然看日志发现程序存在问题 而此刻已意识到由于程序错误 公司已经损失过千万 并无人意识到问题 于是快速反映领导修复 bug 上线 下午被拉着去和运营讨论补救方案 我师傅在安慰我 领导给我说要我被 fire 快拿 n+1 走人(我心里何尝不是这么想) 可是代码上刻着我的提交记录 还好像因为这事取消了我们组的评优和年终 心里挺过意不去的,因为自己的疏忽让全组人背锅,但是这事只是第一天 我才工作半年 我完全 hold 不住 我还有希望吗

8571 次点击
所在节点    职场话题
83 条回复
cnkuner
2019-03-02 00:33:38 +08:00
并夕夕?
NoString
2019-03-02 00:33:49 +08:00
还有 我不是故意的 我是铁笨比 可是这又能改变什么呢
sunnyadamm
2019-03-02 00:34:41 +08:00
不慌,先甩测试,走一步看一步
LxExExl
2019-03-02 00:35:06 +08:00
别想太多 不是你一个人的疏忽

代码有没有 review
定期有没有和老板一对一
有没有开过组会

这些都有肯定不是你一个人的责任 应该全组背锅
这些都没有就更不是你一个人的责任了 应该经理背锅

上班就是上班 领工资就行了
公司拉到投资上市了也不给你分红 董事们开始你也不参加 所以出事了也是公司应该承受的
NoString
2019-03-02 00:36:25 +08:00
@sunnyadamm 现在感觉 fire 不 fire 都无所谓 只是为什么这么严重的问题 大家隔了这么久都没发现 还是妈的我自己发现的
NoString
2019-03-02 00:39:02 +08:00
@LxExExl 首先代码我是没有 merge 权限的 在 merge 的时候也没注意到这个点 不过后面也是 上市也和我没关系 但心里总是很不舒服
zbinlin
2019-03-02 00:41:22 +08:00
先别自己走,等

如果被 fire 了, 先表个白再走 :)
zbinlin
2019-03-02 00:42:45 +08:00
既然没有 merge 权限,那最大的责任不在你这
current
2019-03-02 00:44:02 +08:00
习惯就好啦,出错是不可避免的,所以才需要流程。你是这件事里面责任最小的一个人了
binux
2019-03-02 00:44:29 +08:00
你就是上个班而已,你的任何责任不会超过你的职责本身。
不要给自己加戏,想要加,先提工资再说。
rabbbit
2019-03-02 00:44:59 +08:00
你们的测试 /运维呢?
以前在工厂的时候,领导跟我讲以前车间事故.印错了 2 个字,损失了几十万吧.
处罚结果是所有人都扣钱, 从上到下车间 /质检 /印前 /领导全罚了个遍, 级别越高扣得越多, 也没见开除过谁,因为都有责任,又不是一个人的错.
NoString
2019-03-02 00:46:01 +08:00
@zbinlin 别提了 楼下妹子今天下午一直在一块 没想到认识的方式居然是这样子
NoString
2019-03-02 00:46:49 +08:00
@rabbbit 测试的用例没有遍历到出错的 case
NoString
2019-03-02 00:47:35 +08:00
@binux 那让总监背锅 我是最安全的 狗头
sunnyadamm
2019-03-02 00:49:10 +08:00
@NoString 安心啦,不会让你赔偿损失的,从你的描述看出来你们公司制度还是很不完善的,开发组测试组对功能理解可能也有偏差,领导对项目跟踪不到位,谁都有责任,像我们单位有些服务要线上测试长达半年到一年的时间才会正式上线使用的,额,前单位(刚辞职)。总之安心吧,没有什么过意不去的,这个雷是你们一起埋下的,只是你碰巧触发了而已
NoString
2019-03-02 00:54:09 +08:00
@sunnyadamm 前段时间公司服务血崩 我切了一下午的 redis 投资人的聊天记录被老板发在脸上 第一次感受了什么叫死亡如风,没想才没几个月又来 工作都这么刺激的吗. .. 不过公司制度不完善也是事实,小地方啥都裸奔,过意不去主要是就像自己算错 1+1 然后 emmmm
sunnyadamm
2019-03-02 01:01:38 +08:00
@NoString 还是你内心不够强大,泰然面对即可
foru17
2019-03-02 02:04:39 +08:00
分享一个自己的经历,算是国内最大的某内容网站了,曾经的一个跟支付相关的系统 Server 用的两年前我写的基础架构 1.0 版,另外一个已经离职的同事有做 config 之类的。
然后某天晚上,突然支付系统 bug,第二天早上才预警,持续时间将近 10 个小时,算是 P0 级事故了。
第二天紧急修复,发现是那个架构某处内存泄露,之所以没被发现,是因为这个架构两年前被负责支付部门的团队拿走用后,再也没 update,而那套架构在我们自己的业务环境都升级到到 2.X 了早就 bugfix 了。

最后的处理结果
1.CTO 召集开发、运维、测试、几个部门 leader 集体检讨,分析 bug 原因(代码 code review),流程漏洞,改进措施。
2.硬是背锅的人,leader 是说了离职的哥们,因为是那个哥们 hardcode 的代码和部署的 server,虽然这个架构是我写的,但是我啥事都没有,也的确轮不到我承担责任。

对于公司,对于开发和技术团队来说,这类事故不可能是单一因素造成的。处理得好,对公司开发、上线、测试流程都有帮助,当做经验教训。就我所接触,T 家的任何事故,内网都有系统查询,公开事故原因、责任人、处理结果,解决方案等等,主要还是为了借鉴和经验分享,因为技术 bug 严重处理责任人的,一般都是处理到 Leader 头上,不会到一线 coder。
soli
2019-03-02 04:58:54 +08:00
你应该这么想,你提前一年发现问题并上报,然后迅速出方案补救,为公司挽回了几十亿的损失。公司应该奖励你哈。


另外,敢不敢在发文的时候点个标点?
另另外,以前好像有个 bot is 的发文风格就是没有标点。
dangyuluo
2019-03-02 05:13:38 +08:00
膜拜能造成千万损失的大佬。。我实在是想不到给公司造成千万损失的办法。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/540211

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX