气炸了,我需要吐槽下 xx 同事

2020-04-09 11:39:32 +08:00
 DeadLion

最近因为某些原因升级了 java 容器,从 tomcat 换到 jetty 。

结果有个业务方报故障了,后来查到原因是因为他们在 http header 里 Content-Encoding 传了 UTF-8

结果 jetty 报 501,之前 tomcat 倒是不报。

其他调用方都没问题,就他们业务报障,然后我找到他们希望能尽快改掉,这个按照 http 规范的话肯定就是传错了,他们应该是要设置 charset 。

然后我就被一顿说:你们升级咋不告诉我们,我们以前都是好的,现在要改必须要提需求,balabala 。。。。。

我都无语了,我帮你们发现了 bug,还要怪我?

这感觉就像小偷一直偷偷摸摸,然后被抓了,结果怪警察第一次为啥不抓?

需要时间改可以理解,但是这么理智气壮的甩锅我实在是无法理解。

不知道大家怎么看这个问题。

5155 次点击
所在节点    职场话题
38 条回复
sun1991
2020-04-09 11:48:29 +08:00
那你们升级究竟有没有通知到他们, 或者至少发公开邮件?
b821025551b
2020-04-09 11:51:42 +08:00
首先,框架更新之类的需要完善的测试用例支撑,各种服务都要测一遍,甚至要兼容以前留存的 bug,否则不要去做;
就这次事件来看,他们确实是存在 bug,但是这个 bug 之前没有发现,而是因为你们做了迁移才最终发现,这个锅要算在迁移测试人员以及迁移人员头上,和出 bug 业务线那里没有直接关系;
至于出 bug 业务线那里,和你没直接关系,该怎么处理要他那边 leader 说了算,目前来看这锅就得你们接下来。
lhx2008
2020-04-09 11:51:49 +08:00
提 bug 单改就行,然后如果切换运行环境,也是现在测试环境改吧,也不是很急的事情,说不定还有其他问题,集成测试,收敛回归什么的都要做的
kidlj
2020-04-09 11:53:30 +08:00
你的锅。
hdonghong
2020-04-09 11:58:42 +08:00
老实说,这种情况属于你们的锅
toma77
2020-04-09 12:01:54 +08:00
就算有 bug,之前没问题,因为你们升级而没通知他们使 bug 发作,应该是你们的锅。
k9982874
2020-04-09 12:14:45 +08:00
bug 发现不了就不是 bug,你品你细品
Jooooooooo
2020-04-09 12:18:26 +08:00
你的问题

至少在以下几个方面都有问题, 水平待提高, 这样做事以后也依然会出问题的

1. 风险评估不到位. 组件升级这么重要的事情, 上下游有没有一起评估过? 升级方案是什么? 带来的风险点都考虑了哪些(这个例子显然没有考虑到上游传错的问题)

2. 没有考虑预案, 升出问题了怎么办完全没考虑, 只知道现场查问题, 临时解决, 临时解决往往都考虑不全面, 很容易带来新的问题.

3. 升级东西线上出问题第一想法居然不是回滚, 你们啥业务啊报错就报错无所谓吗?

4. 人家说的完全没问题, 1 升级怎么没有周知. 2 这个肯定不是临时可以改的, 测试啥的都要花时间, 咋能说做就做? 正确做法就是你赶紧回滚, 项目重新考虑
Nimrod
2020-04-09 12:18:32 +08:00
所以升级前没有上下游商量吗?
heww
2020-04-09 12:27:52 +08:00
如果你们这一方不能回滚的话,比如新功能依赖于这个组件的升级。

赶紧在你们的 jetty 前面搞一个 proxy,把 header 给 fix 了再传给 jetty,先解决问题。
rubytek
2020-04-09 12:34:47 +08:00
你们测试环境都不先测一下的吗
rockjike
2020-04-09 12:39:12 +08:00
你的问题,评估影响范围,再一一通知,涉及地方都要测试
DeadLion
2020-04-09 12:44:46 +08:00
@rubytek 测试只会测试自己业务参数,谁会知道在 header 里乱传东西呢
@heww 预生产发现的故障 ,并没有全量更新。所以不存在谁的责任的问题
@Jooooooooo 预生产发现的故障 ,并没有全量更新。也第一时间回滚了
icyalala
2020-04-09 12:49:08 +08:00
"我吐槽的重点不是生产报障谁的责任,而是这个故障发现之后联系业务方修改的态度。"
难道搞清生产报障谁的责任这不是重点吗?
对方规范不好但运行正常,你严格按照规范来把对方搞挂了,你觉得对于公司来说,规范重要还是正常运行重要?
rim99
2020-04-09 12:52:45 +08:00
升级之前没测试吧,至少测试覆盖的不够
yixiang
2020-04-09 13:00:12 +08:00
这个 bug 是对方的 bug 。出现 501 的责任是你的责任。

这是两回事。
aabbcc112233
2020-04-09 13:04:06 +08:00
@DeadLion “我都无语了,我帮你们发现了 bug,还要怪我?”
哪个系统没有 bug,哪个系统没有屎山代码,然而都是要去优化的吗?
不是稳定运行更重要吗?
hq136234303
2020-04-09 13:06:50 +08:00
设计业务服务都得通知其他关联服务的人员吧。我之前有个同事 接口改了都没通知我们嗯,最后线上出了问题,被骂死了。
lxml
2020-04-09 13:07:26 +08:00
感觉别人甩的没啥问题……
wangxiaoaer
2020-04-09 13:09:49 +08:00
我去,楼上都…………

楼主,我顶你,这完全是业务方的 bug 。现在暴露了而已。举个身份认证的例子,别人都是刷脸认证,结果某个客户天天刷屁股,但是也能通过,然后楼主升级了认证端,让那些原本就不合法的刷屁股行为统统失败,然后客户大闹说楼主没有提前通知,这尼玛又不是接口变更、业务变更,通知个迪奥啊!!!

你家应用从 python 变成 golang 也要通知一下客户????

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/660730

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX