如何监控 Nginx?

2016-01-20 14:13:28 +08:00
 OneAPM

什么是 Nginx ?

Nginx("engine-x")是一个 HTTP 和反向代理服务器,同时也是一个邮件代理服务器和通用的 TCP 代理服务器。作为一个免费开源的服务器, Nginx 具有高性能、稳定和较低的资源占用的特点。它拥有丰富的特征集,同时配置也很简单。

Nginx 是少数几个可以解决 C10K 问题的服务器之一。不同于传统服务器,它使用可扩展的时间驱动(异步)架构替代线程来处理请求。尤为重要的是,该架构占用负载下的内存小,且可预测。即便不需要同时处理数千的网络请求,你仍然能从 Nginx 的高性能和低内存占用中受益。从最小的 VPS 到大型集群服务器,Nginx 都能适用。

Nginx 还有一个商业版 Nginx Plus,功能更加丰富。

监控 Nginx 的参数

Nginx 提供哪些监控参数

下表是 Nginx 提供的监控参数及其简单释义。
<table>

<thead>
<tr>
<th>参数名称</th>
<th>参数描述</th>
</tr>
</thead>

<tbody>
<tr>
<td>Active connections </td>
<td>当前活跃的用户连接(包含 Waiting 状态) </td>
</tr>
<tr>
<td>accepts </td>
<td>接收到的用户连接总数 </td>
</tr>
<tr>
<td>handled </td>
<td>Nginx 处理的用户连接总数 </td>
</tr>
<tr>
<td>requests </td>
<td>用户请求总数 </td>
</tr>
<tr>
<td>Reading </td>
<td>当前连接中 Nginx 读取请求首部的个数 </td>
</tr>
<tr>
<td>Writing </td>
<td>当前连接中 Nginx 写返回给用户的个数 </td>
</tr>
<tr>
<td>Waiting </td>
<td>当前没有请求的活跃用户连接数 </td>
</tr>

</tbody>
</table>

通过下面的图,可以清晰的看到参数的具体意义和作用。

当用户请求连接 Nginx 服务器时, accepts 计数器会加一。且当服务器处理该连接请求时, handled 计数器同样会加一。一般而言,两者的值是相等的,除非达到了某些资源极限(如 worker_connection 的限制)。

用户连接请求被处理,就会进入 active 状态。如果该连接没有其他 request ,则进入 waiting 的子状态;如果有 request , nginx 会读取 request 的 header ,计数器 request 加一,进入 reading 的子状态。 reading 状态持续时间非常短, header 被读取后就会进入 writing 状态。事实上,直到服务器将响应结果返回给用户之前,该连接会一直保持 writing 状态。所以说, writing 状态一般会被长时间占用。

Nginx 提供哪些监控参数

下表是 Nginx Plus 提供的主要监控参数、说明以及和 Nginx 的差异。

<table>

<thead>
<tr>
<th>参数名称</th>
<th>参数描述</th>
<th>与 Nginx 差异</th>
</tr>
</thead>

<tbody>
<tr>
<td>Active </td>
<td>当前活跃的用户连接(不包含 Idel 状态) </td>
<td>等同 Active connections </td>
</tr>
<tr>
<td>Accepted </td>
<td>接收到的用户连接总数 </td>
<td>等同 accepts </td>
</tr>
<tr>
<td>Dropped </td>
<td>Nginx 丢弃的用户连接总数 </td>
<td>accepts - handled </td>
</tr>
<tr>
<td>Idle </td>
<td>当前没有请求的活跃用户连接数 </td>
<td>等同 Waiting </td>
</tr>
<tr>
<td>Total </td>
<td>用户请求总数 </td>
<td>等同 requests </td>
</tr>
<tr>
<td>Current(Requests) </td>
<td>当前有请求的活跃用户连接数(等同 Active)</td>
<td>Reading + Writing </td>
</tr>
<tr>
<td>Current(Connections) </td>
<td>当前在线用户数(Active + Idle) </td>
<td>Reading + Writing + Waiting </td>
</tr>

</tbody>
</table>

主要参数和开源的 Nginx 相比较,区别不大。主要就是换了名字,以及通过加减法的参数整合。同样,通过下面的图也能看清这些参数的作用。

具体运作和 Nginx 并无不同,故不赘述。当然,作为商业版,它提供的参数还有很多,可以在这里看。

怎么利用这些参数

开源的 Nginx 提供的原始参数中,实时性的会比较有用,如 Active connections 、 Reading 、 Writing 以及 Waiting 。这些数据能够反映当前 Nginx 的负载情况,方便在服务器出现问题时及时发现问题。而另一些数据由于不是状态量, Nginx 无法计算当前的量值而改做其统计数,如 accepts 、 handled 和 requests 。

对于维护网站人员, accepts 、 handled 和 requests 的统计值用处是不大的,值得参考的是短时间内这三者数值的增量。这个短时间可以是一秒,如 accepts_per_second 、 handled_per_second 和 requests_per_second 。一个简单的做法就是每秒都去读取这些参数,返回一个和上一秒的差值就行。当然, handled_per_second 替换成 dropped_per_second=accepts_per_second-handled_per_second 就更完美了。

通过这七个参数,就可以从连接到请求全方位的监控起 Nginx 的运行状态。为了方便检测,对每次获取的参数保留下来,然后按时间展现出来。下图展示了 Nginx 在运行时的参考数据。

如何获取 Nginx 性能监控参数

开源的 Nginx 会提供一个子网页显示前文提到的监控参数。该网页默认时不开启的,需要开放 ngx_http_stub_status_module 来解锁。默认该模块是开放的,通过以下命令,可以快速确定该模块是否已被开放。

nginx -V 2>&1 | grep -o with-http_stub_status_module

如过返回 with-http_stub_status_module,则说明该模块已被开放,而什么都不返回的话就是没有被开放。需要通过原码构建 Nginx 加上配置参数 --with-http_stub_status_module:

./configure \
… \
--with-http_stub_status_module
make
sudo make install

以上步骤搞定后,还有需要一个配置 URL 来开启 Nginx 状态页。打开你的网站对应 Nginx 的配置文件,添加以下修改:

server{
listen your-website-port;
location /basic_status {
stub_status;
}
}

如果 Nginx 版本低于 1.7.5 ,则需要语法指令添加参数(任意参数):

server{
listen your-website-port;
location /basic_status {
stub_status on;
}
}

修改完成后,需要重新载入 Nginx ,键入命令 nginx -s reload,然后就能在状态页(127.0.0.1:your-website-port/basic_status)看见你的监控参数了。大概是这个样子:

Active connections: 1
server accepts handled requests
38 38 38
Reading: 0 Writing: 1 Waiting: 0

Nginx Plus 和 Nginx 在前面的设置差不多。配置状态页时,需要在配置文件中加上 server 模块:
```
server {
listen your-website-port;

location /status {
            status;
    }

    location = /status.html {
    }

}
```
重载一下 Nginx ,你会在状态页(127.0.0.1:your-website-port/status.html)看到大概这个样子:

顺便安利一下,装一个 Ci,就能看到前面关于 Nginx 基于时间的运行状态的图了。免费注册免费使用,还能设置报警策略。具体,戳这里

Cloud Insight 集监控、管理、计算、协作、可视化于一身,帮助所有 IT 公司,减少在系统监控上的人力和时间成本投入,让运维工作更加高效、简单。
本文系国内 ITOM 行业领军企业 OneAPM 工程师原创。想阅读更多技术文章,请访问 OneAPM 官方技术博客
本文转自 OneAPM 官方博客

2117 次点击
所在节点    推广
2 条回复
abelyao
2016-01-20 15:07:38 +08:00
请发到推广节点。
CC @Livid
hayao650
2016-01-21 09:57:17 +08:00
学习

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/252088

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX