你们都是怎么做大规模的 prometheus 服务方案的?

28 天前
 annoygaga

如题,小弟想咨询一下大规模的 prometheus 的方案

规模主要体现在:

但目前 prometheus 主要是单机的方式,想问问分布式的扩展方法

2049 次点击
所在节点    程序员
28 条回复
duanzhanling
28 天前
可以使用 vm 平滑替换 prometheus
seers
28 天前
k8s operator 直接放集群里面
chankay
28 天前
vm 集群版
F7TsdQL45E0jmoiG
28 天前
联邦,分层聚合
DAPTX4869
28 天前
@duanzhanling #1 vm 的全称是?
standchan
28 天前
@DAPTX4869 #5 VictoriaMetrics
nicholasxuu
28 天前
thanos
qW7bo2FbzbC0
28 天前
VictoriaMetrics
coyove
28 天前
关于数据量和 qps ,可以在 prometheus 或 influxdb 前做一层代理,在那里聚合 metrics 每 30s 上报一次
yph007595
28 天前
@DAPTX4869 #5 VictoriaMetrics
bluicezhen
28 天前
thanos ,长期数据存对象存储
realpg
28 天前
prometheus
没必要搞很大规模的集群
拆解开就完事 拆解成多个 prometheus 也不集群化 各自独立采集 每个 exporter 采集至少两份就好
在可视化层, 比如 grafana 进行数据展现时带逻辑
tramm
28 天前
数据量多大?
说不定根本用不到集群...
chesha1
28 天前
首先对于 Prometheus 的前后,最好有一个 mq (比如 kafka )和持久化组件(比如 mimir )

对于 Prometheus 本身,比较简单的方法就是在不同的机器(集群)上手动多建几个 Prometheus 实例,反正都是放到同一个远程的存储里

如果单个集群就已经大到超过单 Prometheus 实例的抓取能力了,Prometheus 支持联邦: https://prometheus.io/docs/prometheus/latest/federation/,相当于有多个 Prometheus ,后面的 Prometheus 从前面的 Prometheus 抓取数据
liuliancao
28 天前
目前我们是这样
prometheus 1 抓取 federate1 federate2
prometheus 2 抓取 federate1 federate2
proemtheus 用负载均衡去读 alertmanager 配置成 cluster 的方式

你也可以使用 remote_write 功能 这样你的 remote write 配置成 influxdb 两个 prometheus 用同一个数据源就可以了
sampeng
28 天前
唯一解 thanos

prometheus 自带的联邦集群就是个玩具。。。。运维成本其实极其高。thanos 反正一个集群扔一个。反正都是汇总在 s3 的。查询就看你要求了。随便横向扩容。
我以前线上 2000 多个 pod 。查 1 年随便查
annoygaga
27 天前
@duanzhanling VM 本地存储,是不是很折腾?
annoygaga
27 天前
@chankay VM 看上去是单机器存储,是不是很折腾?在 k8s
annoygaga
27 天前
@nicholasxuu thanos 看上去不错,性能如何?多租户好做么?
annoygaga
27 天前
@qW7bo2FbzbC0 VM 多租户如何?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1043123

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX