软路由 openwrt 的 CPU softirqs(软中断)总是异常高而且核心利用不均匀,怎么排查?

2022-06-23 19:24:50 +08:00
 xvnehc

硬件:J4125 + 4 千兆 i211 网卡
固件:openwrt esir 春季小包 5.4.190 内核直装
关了所有服务,包括 clash 、去广告等来测试,

只要跑一会(几个小时或者很快) qbittorrent 跑 PT 下载,
CPU 就会有一个核心是满载,也就是占用 25%,其中几乎是软中断占了全部

这个时候如果 speedtest 测速的话会卡到千兆带宽只能跑 1 、200Mbps ,
因为 CPU 的四个核心会跟着满载 100%,而且都是 softirqs (软中断)占用很高。
重启软路由之后会恢复,但用一段后就又到老样子,

怎么确定是哪里的问题,硬件、固件、网络驱动或者是 PT 软件本身?

图是刚重启以后稍微正常的状况

4507 次点击
所在节点    问与答
17 条回复
ysc3839
2022-06-23 20:25:00 +08:00
一般是 CPU 性能不足,网卡使劲向 CPU 发中断,当一个中断还没处理完下一个中断就到的时候,内核会把下一个中断加入队列,在当前中断处理完后触发一个软中断处理队列里面的。
ysc3839
2022-06-23 20:28:30 +08:00
但如果停止网络活动后还是占用的话,就是别的问题了,一般是网卡跑满速度且每个以太网帧都不大时会出现
xvnehc
2022-06-23 20:30:06 +08:00
@ysc3839 啊,J4125 性能跑个软路由挂 PT 不能说不够吧,我研究了一下说也可能是网卡驱动给到 CPU 的核心处理分配不均匀的问题?
FabricPath
2022-06-23 20:43:56 +08:00
iptables-save 检查 iptables 规则,你的这个场景,软中断消耗基本上只有 netfilter 。
如果没啥异常,perf top 看看是在干啥,不知道 openwrt 有 perf 没
Actrace
2022-06-23 23:30:59 +08:00
网卡支持多队列吗?
Actrace
2022-06-23 23:35:29 +08:00
服务器网卡支持多队列还会 100%软中断的话,试试这个设置 RSP 的脚本,可以分散到各个 CPU 核心及线程。
https://ttttt.link/f/62b487f73e135
YongXMan
2022-06-23 23:53:31 +08:00
我之前也遇到过类似问题,自己编了一个固件负载就降下来了,具体原因不明。
chenyx9
2022-06-24 02:23:02 +08:00
iqrbalance enable
ashong
2022-06-24 02:50:06 +08:00
估计是你 op 固件的问题,一直用 j1900 没问题
i3x
2022-06-24 05:54:52 +08:00
@ashong 他这就是负载问题。。。


@Actrace 解决不了单核性能弱鸡的问题。卡单核后带宽就上不去了。


@cnasing 所有的 jxxxx 恕我直言就是 atom 同级别的玩具。你上传有 500M 吗?没有的话 tr 又不是干不动。
另外不建议用莫名其妙的三方 openwrt 。。。。谁知道有没有加料。。。修改的作者也不全是懂行的,有的人就是根本没有经验就是看着字面意思按照个人喜好看着瞎搞。。。给 openwrt 加上休眠的固件你敢信?内置某网站 ip 监测赚钱的你敢信?更不提给人跑 pcdn 的,跑游戏挂机出口的。。。。。
kokutou
2022-06-24 08:10:43 +08:00
换官方 openwrt 。。。
反正这种什么整合版,编译版,优化版,总是各种小毛病。。
photon006
2022-06-24 18:45:48 +08:00
换固件,我也经常遇到这问题
chancat
2022-06-25 21:50:38 +08:00
我家软路由换成硬路由了,qsdk 真香
yuban10703
2022-06-25 22:04:31 +08:00
关掉 fullcone-nat 试试
kaze1018
2022-06-27 12:34:36 +08:00
软路由是软中断不是很正常吗(🤪
RheatiN
2023-09-10 21:40:05 +08:00
解决了吗,我最近 PVE 不知道动了什么设置,无论是用哪个版本 openwrt ,只要开了 fullcone ,ksoftiqrd 就会异常的高,不开 fullcone ,心里又很难受
galaxyskyknight2
2023-09-18 20:54:27 +08:00
同问,这个问题困扰我三年了,换什么 U 都没用,只要重启用一段时间后,测速就是 high softirq,导致测速跑不满,cpu 负载也是均衡的,四个 cpu 每个都是 20%+, 解决办法就是重启,但好不了多久,特别是给 passwall apply 一下设置后,就特别容易出来这个问题。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/861742

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX