这是一个创建于 1806 天前的主题,其中的信息可能已经有所发展或是发生改变。
有两台 NGINX 作为 7 层代理挂在硬件负载均衡后负责图片相关服务。最近发现这两台 NGINX 机器的内存在缓慢上涨,大概 3-5 天从 20%涨到 40%,上涨的规律基本是在某天的某个整点或者某个小时的第 20 或 40 分上涨 5%左右,一天上涨 0 次到 2 次。看了看定时任务,发现与 NGINX 无关,而且时间对不上。安装了一些模块,如 TFS,Lua 等,还有两个用 Lua 重写请求的功能是自己写的。翻了 NGINX 的 access 和 error 日志,发现没什么问题。dmesg 发现有 worker OOM 的日志,但是应该是上次压测导致的。现在重启了其中一台内存占用高的 NGINX,发现内存从 40%掉到 20%,另外一台 20 多的现在涨到了 40 左右。实在没有排查思路了,寻求一下各位的意见。
5 条回复 • 2020-01-19 20:02:16 +08:00
|
|
1
zhoudaiyu 2020-01-19 19:50:23 +08:00 via iPhone
补充一下 NGINX 版本 1.2.9
|
|
|
2
MeteorCat 2020-01-19 19:52:35 +08:00 via Android
是不是大量 timewait 状态没有解放?
|
|
|
3
zhoudaiyu 2020-01-19 19:56:50 +08:00 via iPhone
|
|
|
4
MeteorCat 2020-01-19 20:00:38 +08:00 via Android
@ zhoudaiyu 那就不清楚了,我上次出现的问题是请求连接数太多导致 timewait 状态爆满才连接不上,看看其他人怎么说
|
|
|
5
zhoudaiyu 2020-01-19 20:02:16 +08:00 via iPhone
|