咨询一个 CentOS 系统网络请求延迟异常变大的问题

50 天前
 gkair

问题场景:

我们在项目上放置了一个工控机,上面部署了一个 Java 服务,用于接收项目上 200 个左右摄像头的 http 请求信息,然后 Java 服务接手以后,进行相应处理,最后通过 tcp 发送到我们的云端系统。每个摄像头的请求频率为三十秒一次。tcp 消息发送为五秒一次。

问题描述:

部署初期没有问题,运行三四个月后,偶尔会出现摄像头推送到工控机的 http 请求延迟非常大,甚至有些会达到 http 请求后过了五分钟,Java 服务中才打印出相应日志。目前,这个问题出现的频率越来越高。并且伴随着这个问题,还发现了一些其他问题。如:

  1. 工控机重启时间非常长,大概 7.8 分钟,并且重启后上述问题无法解决;
  2. ssh 连接等待时间非常长,1.2 分钟;
  3. 手动执行 sudo reboot 命令无效,只能断电重启;
  4. 局域网内,偶尔会 ping 不到该工控机;
  5. yum 命令无法使用,见图;

请问有没有对 linux 比较熟悉的大牛能指点一下,或者能提供一下排查思路,万分感谢!

其他工控机相关

1557 次点击
所在节点    程序员
29 条回复
xiaoranj
50 天前
如果排除掉网络问题的话,有点像硬盘快坏了或者过热导致的
gkair
50 天前
@sinx003 其实我们接受的数据主要在 Java 程序中就处理完成了,完成之后暂存一点统计信息到 redis ,然后就是每隔几秒通过 tcp 发送给业务系统了。基本上没多少磁盘读写。
gkair
50 天前
@crc8 已经准备换了,到时候重新刷一下系统。
@ukec 目前是这样的
#UseDNS yes 该行目前为注释状态
GSSAPIAuthentication yes
@Immunize https://img2.imgtp.com/2024/05/09/3ux2L21U.png 看着好像一堆错误。
a0xbd4CX0DHC1EuT
50 天前
@gkair #UseDNS yes 要取消注释并改成 no ,重启 sshd 服务
hahahahahahahah
50 天前
感觉是硬件出问题了
iloveayu
50 天前
综合分析应该是磁盘的问题
hefish
50 天前
别猜了,硬件问题, 换新之后故障消除。
stcQ2G13k9yxep40
50 天前
free -h ,top 看下,大概率是 CPU 资源消耗殆尽了。我遇到过好几次类似的情况,ssh 连接非常非常慢,经常断,有时候还会报错 fork:retry:Resource temporarily unavailable ,基本上系统资源不足造成的。硬重启以后,问题解决。
gordon96
50 天前
ssh 慢可能 dns 问题,我记着之前遇到过类似

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1039041

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX