关于 RAC 所在服务器偶发性 ping 丢包的问题,请教各位大佬。

2023-07-30 12:36:23 +08:00
 yyysuo
数据库 RAC
2 节点,2 台物理机
内存 192GB
redhat 6.9

应用 HA:
2 节点,2 台物理机
内存 192GB
redhat 7.5

现象:去年突然发现应用运行极缓慢,经排查是数据库的 2 个节点之间互 ping 丢包 50%以上,应用 ping 数据库 2 个节点丢包也在 50%以上,重启数据库节点网络服务后,问题立马解决。
上周五又突然出现了此问题,重启数据库节点网络服务后,问题又解决了。

排查:
OS 日志无异常
应用日志无异常。
数据库不会查。
问题发生时,4 台物理机,cpu 、内存均无压力。

求问各位大佬,这种情况,应该往哪个方向排查?
705 次点击
所在节点    问与答
8 条回复
RatioPattern
2023-07-30 16:05:28 +08:00
交换机
we6100
2023-07-30 18:14:56 +08:00
Ping 的话,最好不要是 vip 而且物理 ip ,也可以出问题的时候关一个节点试一下,是不是 Rac 的问题还是硬件问题
yyysuo
2023-07-30 19:03:01 +08:00
@RatioPattern 现在的状态是系统受到监控的,不能随便停,有没有哪边的日志,或者一种技术手段,能够确认到出问题的环节?
yyysuo
2023-07-30 19:05:19 +08:00
@we6100 忘记说另外一个情况了,把数据库关了依然是丢包的状态,重启一下网络立即就好,好上一年自己突然就坏了。
we6100
2023-07-30 20:21:58 +08:00
@yyysuo 数据库只是 Rac 的一个资源,很有可能是 rac 有问题
yyysuo
2023-07-30 22:09:07 +08:00
@we6100 可是我用的操作系统自己的 ping 呀,rac 不了解,会影响到系统的 ping 吗。
RatioPattern
2023-07-31 00:12:15 +08:00
@yyysuo 交换机支持 SNMP 的话可以用 SNMP 看下设备占用
RatioPattern
2023-07-31 00:12:35 +08:00
感觉可能网络风暴

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/960939

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX