空降领导炒掉运维, CI&CD 工具被我搞出问题了,焦躁不安又非常挫败。

2019-07-24 17:25:57 +08:00
 jmyz0455
具体的问题在这里:v2ex.com/t/584034 此贴纯粹吐苦水。

我们团队空降了老板的亲信当领导,从此过上了苦日子,我们团队本来有位资深运维搭建了 Jenkins + JIRA + Slack ( notify ) + GitLab ( hook )的环境,日志、备份、部署、发布井井有条的,但是空降的领导觉得这一套环境搞好之后,运维没事做工资又高,新项目上线之后就用各种手段逼走运维。

运维走了之后,我们的这套环境简直像黑箱子一样,没人敢动,说是交给某位后端大哥在管,但是貌似这位后端的 Linux 玩得貌似还没我 6,各种粗暴 root kill 操作,当然了我也只是个业余搭来玩玩的水平。

然后就在一周前,我某个前端项目提交上去之后,自动化构建从此就失败了 \@\_\@ ,心里那个苦啊,我居然踩了这颗雷。更要命的是任何 npm 命令都能跑,唯独 npm 的构建命令不能跑,更没有**任何输出**。

这几天就真的是挠破脑袋了,身边没有任何朋友是做运维的,我想尽任何我能想到的方法去暴露、定位问题:尝试回滚代码(无效)、--verbose 啰嗦模式构建(无效)、npm audit 包管理检查(无效)、Docker 运行空间和内存检车(无效),甚至看官方文档,进到服务器 Docker 里面用 Jenkins CLI 跑任务,在 console 里依旧没有任何有用的输出,npm 和 jenkins 似乎也找不到任何有效的日志或报错。

但是这个项目 git pull 到任何一台普通电脑都是可以构建和输出日志的。我看到 Docker 里 npm 和 node 的版本跟我本地是不同的,却又不知道 Jenkins Docker 的 node 环境是怎么装进去的,也不知道应不应该花时间处理这个(也许又是没有帮助),完全是一片苍白的知识领域,不知道如何定位和解决问题。

现在这个项目的自动化构建完全停住了,领导怪罪下来我也完全没有办法,估计下一个被逼走的就是我了,难受,上来吐槽一下。
23207 次点击
所在节点    程序员
153 条回复
xuanbg
2019-07-25 08:48:47 +08:00
我们老板倒是明白没事干的运维才是最好的运维这个道理,真是个聪明的好老板。

可惜我们的运维天性爱折腾,折腾完没事干就自己走了。。。自己走了。。走了。。。
hmxxmh
2019-07-25 08:54:31 +08:00
@friddle 我公司运维比开发多😂,就我们部门都二十多个运维
jsnjfz
2019-07-25 08:55:24 +08:00
@CallMeReznov 老哥阔以。说实话我也搞过 jenkins 提交以后 Hook 编译发布,说实话不复杂,可我是后端,而且不在 docker 环境中。前端做到这样可以了。这领导估计就是那种“谷歌就一个画面,一天给我搞定”的这种。跑是肯定的了,建议还是先找好工作。
jsnjfz
2019-07-25 08:56:12 +08:00
话说 jenkins 的日志里面也没信息么?
huruwo
2019-07-25 08:57:04 +08:00
搞出问题了?等律师函吧你
hmxxmh
2019-07-25 08:58:39 +08:00
@xuanbg 这种都是有自己的目标及想法的,很佩服这样的人
Cyron
2019-07-25 09:00:07 +08:00
首先 sb 领导,其次 jenkins 要学也不难
lFOqSK
2019-07-25 09:00:16 +08:00
设定个定时任务,时间到了就把黑箱里的某些配置改了或者删了某些组件重启,然后自我删除。实现这样的程序不难吧?
我猜楼主只是运气不好,刚好是黑箱炸了之后第一个用的,所以会产生是自己弄坏的错觉
当然,这种也是死无对证的,毕竟证据肯定已经自毁了。楼主再自己研究下去的话,首先肯定是自己修不好的,其次之后请人来修好的话,责任肯定也是在楼主身上。毕竟楼主能怎么证明自己没有改过或者动过被弄出问题的部分?如果定时炸弹不止一个,下一次弄出生产事故,又会是谁背锅?所以建议楼主尽早跑路。
CallMeReznov
2019-07-25 09:02:13 +08:00
@xuanbg #81 是个狼灭
jay4497
2019-07-25 09:03:22 +08:00
这种事肯定是不能接的啊,就算会也要说不会、弄不了,又不多给钱,就现在你这环境,只要你说会,以后铁定这事就成你的事了,所以多一事不如少一事,最最不好的结局也就辞退呗,这种公司还想多待?
lFOqSK
2019-07-25 09:05:38 +08:00
其实至少在我的圈子里,交付成品的时候设些绊子防止甲方吞尾款是很正常的事情。拿到全款的时候再给个升级补丁包。楼主可能涉世未深不知道还有这种操作。=_=
hyy1995
2019-07-25 09:06:45 +08:00
开“猿”节流
7654
2019-07-25 09:09:18 +08:00
这件事不要想着用技术手段解决,既然以前有运维岗,被裁掉了,那就不要用运维手段发布新版本嘛:doge
golden0125
2019-07-25 09:13:21 +08:00
我也倾向是定时炸弹式后门,只是 LZ 运气不好恰好碰到了而已
cominghome
2019-07-25 09:20:04 +08:00
@gouchaoer 你这就 ETC 了吧,UP 主说搭了这个,也没说人家不会你说的那些东西吧?
而且讲道理,CI/CD 运维都会(可能也不是都会)搭,但是能玩好,开发测试运维都觉得好用的也不是谁都能做到吧,中小型公司有这么一套流程,你知道省多少功夫嘛。
smilzman
2019-07-25 09:21:33 +08:00
看了你之前的描述,很可能服务器进程没有正确退出,导致一开始编译就“卡死”,登录服务器看下进程,把异常的 kill 掉,然后重启 [手动] Jenkins 服务,然后再构建一次,还有也可以试试构建前执行 rm lock 文件的操作。
yuzhiquan
2019-07-25 09:22:45 +08:00
运维闲着是贵司之福。。。
Tezos
2019-07-25 09:24:05 +08:00
全公司 wx 拉黑?我看留一手几率较大啊
dyrex
2019-07-25 09:24:34 +08:00
@stupil 有 jd 吗?
danc
2019-07-25 09:26:11 +08:00
正好可以找个机会离职了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/585867

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX