我所知道的精细到每个进程的监控都仅仅反映实时情况;
而可以看到历史数据的都只有综合的图表,没有细分到进程、用户的,比如整个机器的 CPU/内存 /磁盘读写使用情况。
所以想请教一下,想可回溯地统计精细到进程、用户等的信息怎么做到。
1
hadoop 2017 年 7 月 10 日 via Android 进程级流量监控没看到比较好的
|
2
ldbC5uTBj11yaeh5 2017 年 7 月 10 日 via Android 我用 Prometheus 和 granfana 做过,自己写 exporter 而已,不难。
cpu 内存磁盘最容易。其中 tcp 流量监控复杂一些,要用内核的新一些的特性才比较容易做。 |
3
ldbC5uTBj11yaeh5 2017 年 7 月 10 日 via Android
哦,忘了说,据我所知,市面上没有现成开源的,所以我才自己弄的。
|
5
ldbC5uTBj11yaeh5 2017 年 7 月 10 日 @hadoop 嗯,用的是 tcp_info 这个结构,原理和 netflix tcptop 差不多。不是非常准确,但是够用了。
|
6
ldbC5uTBj11yaeh5 2017 年 7 月 10 日
也许我那天可以问上面,是否可以把这个 exporter 开源,也算解决痛点填补空白了。
|
7
ldbC5uTBj11yaeh5 2017 年 7 月 10 日 哦,还有变通的一招。
把进程容器化,然后用 cadvisor。(这货非常吃 CPU 慎用) |
8
rswl 2017 年 7 月 10 日 grafana + influxdb + telegraf
|
9
QQ2171775959 2017 年 7 月 12 日
专业的工具还是有蛮多的嘛。。。老兄多去试一下。。
|