UDP 流量一大,整个服务器的网络就崩溃

124 天前
 newshbb

一台 Linux 服务器上的 UDP 服务(类似 STUN ),大概服务几十万个客户,每秒大概 50Mb 输入流量,在 aws/vultr/aliyun 上都没问题,但是在 azure/digitocean/hetzner 跑不起来,后三者都是同样的问题,服务器上 ping 也 ping 不出去,我这边 ssh 也连不上,不过没有关的连接没问题,我的 udp 服务也基本瘫痪,流入很大,但是有效流出很少。azure 的 support 倒是很热情,电话邮件来回好几天,可就是解决不了问题,instance 也重建好几遍,数据中心也换了好几个。

不知道大家有没有遇到过,有啥 linux 参数可以调节一下?

谢谢

2127 次点击
所在节点    程序员
11 条回复
laminux29
124 天前
1.对比一下两边的硬件情况。

2.aws/vultr/aliyun ,这 3 个能跑起来的 Linux ,直接 tar + zstd 整机备份到 azure 上,看看情况。
patrickyoung
124 天前
pps 有多大,像是触发了防 ddos
FabricPath
124 天前
试试 sysctl -w net.netfilter.nf_conntrack_max=5000000
opengps
124 天前
公网大流量走 udp 很容易受到限制,这个限制往往在网络层面,不再你机器内部,所以你先查查流量不到你服务器的原因是哪个环节
lambdaq
124 天前
@FabricPath 感觉 conntrack 都是 tcp 的吧。。udp 也用 conntrack ?
ttvast
124 天前
服务器先搞一个带外管理,看看数据包到底有没有到达服务器。
newshbb
124 天前
@opengps
@patrickyoung
不像,因为 azure 的 support 自己也没查出来
4kingRAS
124 天前
你的出流量是哪个地方的监控,如果是宿主机的监控,那说明是宿主机里的限制,看 netstat -s 有无信息,dmesg -T 如果有限制会报错。如果是出口网关的监控,那就看链路上有没有限制
FabricPath
124 天前
@lambdaq conntrack -L
al772
124 天前
我们的产品在 Azure 上有个已知问题,UDP 连接会被砍掉,Azure 的设计缺陷,关键词 flow control
newshbb
124 天前
@4kingRAS vnstat

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1017796

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX