多源数据融合,建数仓,数据统计分析一般有哪些架构和技术?区别是什么?

2019-12-03 16:43:56 +08:00
 yellowmarlboro

问题源于一个需求:把很多不同业务的数据融合(各种类型,日志、营收、监控以及物联网设备等所有数据),需要对所有数据做统计分析以提供决策支持,有一些情况如下

对这方面了解不多,对于 Hadoop,Spark,流处理批处理,数据仓库,数据集市之类的,虽然之前间接接触过,不过毕竟没有动过手,动手的只是其中小部分,其它的也只是了解大概。
心里大概有个模糊的流程和架构,但是具体可以采用哪些框架,流程是如何,为什么用这个或那个,还不定。有没有人大概讲解一下! thx !

#学习中#

888 次点击
所在节点    程序员
23 条回复
levelworm
2019-12-04 13:48:44 +08:00
@cco +1 KIMBALL 的书都可以看看
fff333
2019-12-05 00:00:57 +08:00
@levelworm 写的很棒
levelworm
2019-12-05 00:46:19 +08:00
@fff333 技术方面还是看 @SlipStupig 的帖子,我那个是流程的。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/625567

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX