把生产服务器干烂了

246 天前
xiaozhu317  xiaozhu317

-原由:服务器的 SSH 需要升级,因为发现了一些 SSH 漏洞

-过程:我使用的别人整理好的 rpm 文件,确实在测试服务器中升级成功了,但是在正式服务器中升级失败。可能是服务器的 glibc 版本太低,可能导致新版本 SSH 升级失败。(可能有人会问,为什么不自己编译,我在测试服务器自行编译成功升级了,使用 rpm 文件也成功升级了,于是就优先使用的 rpm 文件)

-结果:升级失败后,SSH Session 直接断连,远程连接不上,只好联系服务器供应商。

-庆幸:这个服务器没有在部署的应用,都停掉了,这是唯一庆幸的一点。

-总结: 1.遇到 SSH 升级问题,联系供应商,不要自己尝试,就算自己尝试,提前在供应商那备份快照。 2.确实需要慎重操作服务器。涉及升级软件的操作,一定多测试测试,多准备几个测试环境。 3.工作的时候难免有急躁的时刻,这个时候才是真容易犯错。 4.欢迎各位 V 友指导

13600 次点击
所在节点   服务器  服务器
86 条回复
tool2dx
tool2dx
246 天前
可以临时开一个 dropbear 端口来应急,反正 ssh 又不止一个 openssh 。
lstz
lstz
246 天前
18 年我遇到过 glibc 升级的坑,万幸没有数据丢失,只是 centos 会有一丢丢不正常而已
supuwoerc
supuwoerc
246 天前
刺激
julyclyde
julyclyde
246 天前
(可能有 sb 会问)
julyclyde
julyclyde
246 天前
你这个总结其实没啥用
没抓住本质,你的结论就是把事情推给别的(可能也不靠谱,甚至还不如你)人去做
uiosun
uiosun
246 天前
@lstz 所以是不是该常升级 glibc ?
xiaozhu317
xiaozhu317
246 天前
@julyclyde 哈哈哈哈,最主要的原因还是我太菜了~
xiaozhu317
xiaozhu317
246 天前
@tool2dx 现在我们这边连不上了,他们那边在处理中哈哈,希望能处理好
julyclyde
julyclyde
246 天前
@xiaozhu317 我盲猜一下
你的 rpm 并不兼容你这个操作系统版本,而是针对另一个操作系统版本的
你装的时候也应该有依赖关系不对的情况,然后你--nodeps 强桩进去了
xiaozhu317
xiaozhu317
246 天前
@supuwoerc 吓坏了
xiaozhu317
xiaozhu317
246 天前
@lstz 哈哈,我也是万幸,正好没有什么应用在跑
xiaozhu317
xiaozhu317
246 天前
@julyclyde 牛,你猜对了,我确实是这样操作的。在测试环境中我编译是升级成功的,rpm 也是可以升级成功的,我图省事就直接选择用 rpm 了,然后直接--nodeps ,就麻烦了。只能说我还是水平不够
kinkin666
kinkin666
246 天前
简单点,下次直接先刻一台升升看
julyclyde
julyclyde
246 天前
@xiaozhu317 不是我牛;你这属于“错的很标准”

很多软件都和 glibc 、openssl 这几个基础组件有明确版本的依赖关系; glibc 本身应该是有几个小版本的适配宽度; openssl 是 1.0 、1.1 两个系列内部各自兼容,但是 openssl1.0 和 1.1 应该是不兼容的,它家的版本号定义和通常风格不一样

操作系统的大版本升级,这几个基础组件一般都会发生升级(然后才有能力支持更新的其它软件)
DonaldErvinKnuth
DonaldErvinKnuth
246 天前
我也遇到过一次,也是因为 centos6.7 的太老,只支持 rsa ,不能用更高的,就想的升级,结果升级失败,连不上了。还好有一个连接没断,又查资料退回来了,吓死了。
xjzshttps
xjzshttps
246 天前
不是运维,
可以请教一个问题吗?安全问题升级 ssh 为什么需要自己找包?
操作系统没有提供安全更新补丁吗?
我一般用的 ubuntu ,sudo apt-get update && sudo apt-get upgrade -y 就完事,其它系统也有自己的包管理提供安全补丁吧?
xiaozhu317
xiaozhu317
246 天前
@xjzshttps 操作系统版本太老了
xiaozhu317
246 天前
@DonaldErvinKnuth 咱俩的版本甚至一致哈哈
xiaozhu317
246 天前
@julyclyde 受教了受教了老哥
676529483
246 天前
以前搞 nfs 备份时,mv 了一半,手贱 ctrl+c 了,重启就文件系统报错了,联系了云服务商也解决不了,大数据训练的模型丢了。。。
以后每次搞生产服务器,就只敢先快照了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1059898

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX