一个弱智的问题, hive 数仓的数据同步,如果源数据库里面的数据被修改了,那怎么办

2020-01-01 14:37:48 +08:00
 zhxjdwh
如题:hive 数仓的数据同步,如果今天订单导入 hive 了,第二天用户又修改了订单信息,那怎么办?这样 hive 里面的数据就是脏数据了,这样的话,做分析统计 就跟实际的情况 就会有比较大的差异了
------
是不是还要一个数据更新的机制?这个一般是怎么处理的?
1557 次点击
所在节点    问与答
3 条回复
laimailai
2020-01-02 09:00:57 +08:00
我们是每天覆盖
laimailai
2020-01-02 09:01:39 +08:00
还有个拉链表方案去看下
zhxjdwh
2020-01-03 08:24:44 +08:00
@laimailai 谢谢,我了解一下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/634166

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX