请教一个分布式问题, 具体请看正文描述,非常感谢!

2020-08-07 23:00:48 +08:00
 vchat

有一批数据在数据库中,分 128 表按小时增量存储,现在有多个机器 每一小时处理一次,这些机器是消费者角色, 每个小时生产数据后,及时消费处理这些数据,待这个小时的数据全部处理完成后 汇总这一个小时的数据,这里面涉及多个分布式协调问题, 请教一个比较好的解决方案?

注意点

谢谢大家啦!麻烦大家推荐案例或者书籍或者大致思路, 不甚感激!!

1631 次点击
所在节点    程序员
4 条回复
billlee
2020-08-08 00:02:01 +08:00
这不是典型的 map reduce 问题吗?直接用 spark 得了
vchat
2020-08-08 00:08:30 +08:00
@billlee 整体上是这样 但是这个一是没有这么大的数据体量 用 spark 太牛刀了 二是 需要在一个 java 语言的系统中处理
lhx2008
2020-08-08 00:24:54 +08:00
这种就是流式计算之类的,不要自己写轮子了,也没有必要用 sql 分表什么的。。
billlee
2020-08-08 00:28:46 +08:00
@vchat #2 128 分片我觉得已经不算很小了吧,你也提到了很多需要注意的问题,这些都自己解决不就是重新发明 spark 吗? Spark 也是 jvm 生态的啊,可以用 java 开发应用

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/696605

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX