如何说服领导同意升级内核到 5.4?

2022-08-30 21:34:13 +08:00
 zhoudaiyu
目前有 6 台物理机系统是 RHEL 7.6 内核大版本是 3.10 ,跑着 K8s 1.21 ,环境是灰度环境。但是由于内核版本较低,有时候会产生 CPU SOFTLOCK 的问题,机器负载飙升,影响稳定性。查了一下相关的文档,都让升级内核,但是没有说具体的要升级到的版本。我的意思是直接 yum 安装一个长期支持版本的内核( 5.4 ),支持启动时加载不同版本的内核,可以随时修改后 reboot 生效。但是领导担心跨的版本较大,他的思路是升 3.10 最新版小版本的内核,但是我觉得 3.10 太老了,升级了也不一定好使,而且长期支持版本也比较稳定,没必要担心。领导让我调研大厂现在用的最多的每个版本,这玩意也没处调研吧。大家怎么看这个事?
5578 次点击
所在节点    问与答
72 条回复
zhoudaiyu
2022-08-31 10:00:09 +08:00
@echo1937 灰度,不是生产
zhoudaiyu
2022-08-31 10:10:08 +08:00
@litguy 也是跑 K8s 吗
ICB
2022-08-31 10:12:45 +08:00
领导只管你一个人吗?要不是就他说升啥就升啥,也不是你自己家的东西,操那些闲心你是为了啥?
shyangs
2022-08-31 10:22:19 +08:00
@zhoudaiyu

開發環境、測試環境、灰度環境、生產環境.

灰度環境不就是小範圍的生產環境,一部分用戶已經用上了的,叫灰度.
zhoudaiyu
2022-08-31 10:30:39 +08:00
@shyangs 我们的灰度就是自己测的,
Zy143L
2022-08-31 11:39:44 +08:00
国人讲究调和择中
给领导说直接换系统 他可能就会同意升级内核吧
choury
2022-08-31 12:18:54 +08:00
5.4 太低了,bpf 都不好用
msg7086
2022-08-31 13:50:09 +08:00
稳定版系统本来就不太好随便换内核。
3.10 内核很老吗?
kernel-3.10.0-1160.76.1.el7 ,更新时间 2022-07-26 ,才过了一个月你就嫌老?

你一定要换的话也是优先考虑换 UEK ,企业用的,elrepo 的 kernel-lt 只是官方打包,测试强度比不上企业级软件。
(当然如果你们不考虑稳定性的话随便换就是了,只要你能说服领导用野生内核包。)
litguy
2022-08-31 14:18:09 +08:00
@zhoudaiyu 最底层跑的我们自己开发的分布式存储,上面跑的 openstack
victorc
2022-08-31 14:30:38 +08:00
你们 leader 的思路是正确的,线上环境要谨慎,没事别瞎搞,各种软件(包括 linux 内核)非常复杂,质量无法保证,经常会有意外发生,别给自己找事
salmon5
2022-08-31 14:41:04 +08:00
领导是对的,你现在都是小问题,可控;如果倒腾一番,就不可控了
salmon5
2022-08-31 14:41:33 +08:00
劳心劳力被吊打的还是 leader
BeforeTooLate
2022-08-31 14:52:21 +08:00
就我觉得领导是对的吗?
dynastysea
2022-08-31 15:09:12 +08:00
赞同升级的,一般是没经历过毒打,只能说业务规模不大。但凡是上点规模的公司,面对复杂的业务场景,内核升级都是重中之重,非必要是没人敢随意升级的。内核里潜在的坑真的太多太多了
cnbatch
2022-08-31 15:10:04 +08:00
最好先升级到 RHEL 7.9 。稳妥起见可以只升级一台再看看后续。

鉴于 RHEL 7.9 对于 7.6 而言只是常规更新,所以可以试下这样跟你的领导讲:不如把系统常规更新、补丁包都安装好,说不定问题就修复了。
shika
2022-08-31 15:49:49 +08:00
我升级过 5.4 ,我觉得你领导是对的
waye121
2022-08-31 15:56:36 +08:00
这是换个内核能解决的问题吗?
有问题 case by case 的解决,kernel 和 硬件 强相关,是不是把机器一并换了。
newmlp
2022-08-31 16:06:10 +08:00
先升了再说,管他领导不领导,他还能把你手铐起来不让你升咋地
ziseyinzi
2022-08-31 16:07:27 +08:00
你领导是对的。只是咖啡喝多了会心悸,不至于开刀换个心脏。
Remember
2022-08-31 16:08:33 +08:00
生产环境升级内核?生产环境都是整个机器替换掉的。

3.10 内核是 rhel7 ,8 年前 2014 年发布,rhel8 是 4.18 ,2019 年发布,所以你机器年龄已经是 4~8 岁了,是时候换掉了。
就算不换,也最好是分批轮流整体升级到 rhel8 ,rhel9 去。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/876571

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX