公司要做个数仓,单机 hadoop 是否没什么意义,但是又想自己动手做一下。求给建议!

2020-05-25 18:10:11 +08:00
 yellowmarlboro

背景

需求

想法和问题

总之就是想用这个机会学习动手点新东西而且做好,但是这个架构什么的对我来说还是比较难,所以想得到各位大佬的建议

3444 次点击
所在节点    Hadoop
8 条回复
xcstream
2020-05-25 19:14:11 +08:00
玩玩可以, 单机随便装个数据库都差不多
MinQ
2020-05-25 19:22:40 +08:00
玩玩可以+1,但是现实意义不大。大数据也是一样,挺多公司都想搞大数据的,结果不是数据量少得可怜,就是数据量少得可怜的同时质量也不行,各种缺项。再说 sql server 啥的一样搞大数据啊,python 找个 driver 登上去取数据导入到 pandas 里就是了
VoidChen
2020-05-25 19:23:21 +08:00
单机意义不大。。而且数仓是一整套的东西,不是说把数据丢进去就算了。。我觉得你们要是只是一个历史数据存放而已,hdfs 直接放格式化的文件就可以了。还是那句话,hadoop 最少还是给 3 台吧
diggzhang
2020-05-25 19:31:15 +08:00
可以从 clickhouse 或 greenplum 开始?轻量搞起来试错。
limbo0
2020-05-26 02:52:53 +08:00
意义确实不大,单机还不如在自己机器上搭建呢
est
2020-05-26 10:33:23 +08:00
单机 hadoop 性能不如直接 grep 吧。
yellowmarlboro
2020-05-26 11:16:37 +08:00
@xcstream @MinQ 我也是想试一下,但是又担心跑在( 8g,机械盘)上边会慢的要死。不知道多大数据量会多大速度
MinQ
2020-05-26 11:45:00 +08:00
@yellowmarlboro 我估计跟 SQL Server 查询速度差不多?不过我也是用的公司集群,自己电脑上只是小数据量做测试用的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/675347

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX