使用 kafka 场景中到底使用数据生产者的集群还是消费者的集群?

2020-11-09 20:45:52 +08:00
 alexfarm

背景:我们系统提供的是对话数据语义离线分析的服务,可以算是个通用底层能力。这次的上游系统是一个客服系统,业务希望他们的数据接入到我们系统中。 问题:上游系统把数据放在他们 kafka 集群让我们自己去消费处理格式,处理格式也就算了。要对接上游的 kafka 集群就炸了啊。我说提供一个封装好的接口调用就可以了,我们自己放自己的 kafka 集群消化数据,还被拒绝了。 主要还和我说一般都是放在生产者的 kafka 集群的,虽然我是渠道方可能也会这么做,但我现在做的是一个平台,如果对接上游的 kafka 集群,那工作量也太多了吧,如果上游没 kafka 集群,还要多一种接入方式?回归测试的时候还要依赖这些 kafka 集群的状态?

954 次点击
所在节点    问与答
1 条回复
julyclyde
2020-11-11 11:56:14 +08:00
kafka 的消息可以被不同 consumer group 分别多次读出
所以集群肯定是归属于 producer 的

你如果想有自己的集群,可以做一下复制

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/723354

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX