某五百强信创数据库运维幽默记录

63 天前
 chowdpa02k413
某五百强信创数据库,为了搭配他们的 arm 硬件,把物理安装的配置需求设计得十分严格,核数内存比 1:8 ,至少 8C 起步,否则安装检查不通过。

(但是容器化模式下允许 4C16G 安装)

一个集群 3 节点,也就是每个 cluster 至少要吃掉 24C192GB 内存,我们这边 base 的机器资源不够,调动用外地的机器,两地之间网络全隔离,需要开单申请端口放行

开始之前,我问某五百强技术支持,我们网络隔离,完成任务 1 需要开通什么端口

技术支持丢给我一个《端口矩阵》,林林总总列出了所有组件的端口接近 100 个,但是没告诉我是干什么用的,说可以参考这个文档

然后选了几个看起来要用的端口,提交了审批,等了 2 天,端口批下来了开始干任务 1

卡住了,几百个组件查 log 查了俩小时,发现它在任务过程中冷不丁地要请求一个端口 A 才能完成,具体来说,它下发 agent 包用的不是 scp ,而是要求 node 反过来请求 controller 的自建非标端口 sftp

OK ,反馈,继续开审批,然后追问五百强技术支持,你们任务 1 还涉及什么端口能说说吗?任务流程全是黑盒子,使用手册没有、矩阵文档也没有

技术支持说,你看看端口矩阵,自己整理下

OK ,等了 2 天,端口 A 批完了,继续任务 1 ,结果卡在另一个地方,再查俩小时 log ,发现这个子任务靠 ping 判断 node 的网络连接,但我们没开 ICMP

OK ,继续开审批,把 ICMP 开了,我再追问技术支持,你们还有什么端口要访问的,能不能说清楚

他回答我,那个端口矩阵你可以看下

等了 2 天,ICMP 批下来了,继续任务 1 ,结果卡在最后一个子任务,这个任务在矩阵文档里写的是要用端口 B ,之前已经批过这个端口,测试也顺利放行。

继续查 log 和测试,俩小时之后发现这个子任务实际上在用端口 C ,而非 B ,端口 C 没开通

OK ,继续开审批,等了 2 天,把端口 C 开了,最后终于跑完了

半个月时间消失了

接下来做任务 2 ,毫无意外地卡住了

查 log 两小时,发现这个子任务试图让 node 终端请求 controller 的 Kafka 来获取一些任务参数,这个端口当然是没开通的,哥们,你是个数据库啊

反馈技术支持,追问,你们任务 2 要什么端口

技术支持进入了已读不回状态
10486 次点击
所在节点    程序员
99 条回复
levelworm
63 天前
@seers 这些数据库怎么这个样子?国内的那些也是如此吗?
kangyue9999
63 天前
arm 的 aarch64 64k pagesize 可能 是一个原因
LieEar
63 天前
他这个数据库是自己从 0 开始写的吗?还是开源套皮的
chowdpa02k413
63 天前
@NessajCN
这家五百强的风格是为每个项目指派一个专门负责人对接支持,无论是 poc 还是正式交付的项目,从程序上来说是挺好的
但架不住已读不回的就是这位负责人
chowdpa02k413
63 天前
@seers
吃一堑长一智,以后会这么干了
jinsongzhao
63 天前
其实不用关心是否套皮,关心一下哪些能超越的,超不过就赶紧加入,努力成为那个没了我,你也要完蛋的加入者。
vagusss
63 天前
已读不回, 直接向上反馈说不配合, 花了钱还遭罪这家也太牛了.
totoro52
63 天前
@LieEar 信创基本是套皮,没几个是自己的
totoro52
63 天前
“发现这个子任务试图让 node 终端请求 controller 的 Kafka 来获取一些任务参数”
一个数据库为什么还需要 Kafka 。。。 好奇
1018ji
63 天前
话说你是咋想的敢问第二次呢
dacapoday
63 天前
特有的客户当孙子,信创,腐败的温床。
lltlo
63 天前
@vagusss 下回可能就是不读了
huzhizhao
63 天前
信创项目嘛 设计是这样的
HusaYn
63 天前
好日子还在后头呢
yeyang5211
63 天前
@dacapoday 我只能说确实挣钱,这孙子不白当.. 有专门的信创拨款
fengye0509
63 天前
@chowdpa02k413 #4 我觉得第一次卡住 你再去提审批就该考虑一下,这个技术提供的端口矩阵不准确,需要你来沟通和测试后完善一下再去申请新的,永远不要相信别人提供的
dif
63 天前
@povsister 那卖的是产品吗?卖的是人情世故。 虽然觉得这些软件恶心。
leaflxh
63 天前
烂先不谈,以后别炸就行。炸了那可真是搬起石头砸自己的脚
mark2025
63 天前
还有更幽默的的 vx 公众号 人在信创
az467
63 天前
某几家的产品,
说是信创数据库,其实是基于 pgxl 架构改出来的缝合产物,还自带运维平台,不是通常意义上的单纯数据库。

所以不但有 kafka ,甚至还可能有 redis ,zookeeper ,es 等等一堆东西。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1035840

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX