物联网大数据用什么数据存储方案

2019-08-28 14:00:32 +08:00
 daijinming

如果要搭建物联网大数据平台,接收来自众多设备的时许数据,以及分析查询,预警等功能,这样的要求需要采用什么样的数据存储方案,sql 数据库还适用吗

4009 次点击
所在节点    问与答
15 条回复
nnnToTnnn
2019-08-28 14:06:54 +08:00
推荐使用 apache hadoop 当然 mysql cluster 也能支撑,但是生态没有 hadoop 的强,这是我了解到的
chucongqing
2019-08-28 14:08:21 +08:00
hdfs
qihao
2019-08-28 14:17:48 +08:00
influxdb、opentsdb 时序数据库
daijinming
2019-08-28 14:22:39 +08:00
@qihao 朋友这种数据库好用吗,相对 sql 而言
netnr
2019-08-28 14:35:26 +08:00
说个文件数据库方案,用 sqlite,按设备按日期分文件(夹)存储
可以用常规的关系型数据库存储设备列表,每一个设备所产生的数据,分文件夹,分月或周或天存储,分的颗粒度较小时,可以间隔一段时间生成中间统计(按天存储时,一个月完,生一张月统计表,一年完生成一张年表,方便后续查询统计)
freeznet
2019-08-28 16:51:20 +08:00
时序数据的话无脑推 timescale db
huiyifyj
2019-08-28 16:52:18 +08:00
hadoop 系列 HBase 数据库
funky
2019-08-28 16:53:38 +08:00
无脑 timescaledb +1
daijinming
2019-08-28 17:06:20 +08:00
@huiyifyj 听到 HBase 感觉好重呀,好上手吗,我们这边都是 SQL 数据库,真是有点闭塞了
huiyifyj
2019-08-28 17:11:08 +08:00
@daijinming #9
HBase 是列式数据库,与平常的数据库有些反向,所以只要懂过这之中的区别就应该可以上手。
ccl945
2019-08-28 17:53:23 +08:00
druid,clickhouse (来自一个大数据之神的建议)
kifile
2019-08-28 18:03:16 +08:00
看数据量级,每日大文件增量(GB 单文件),上 HDFS.
小文件增量,数据总量 TB 级别,考虑分布式部署,使用 Greenplum,
小文件增量,数据总量 TB 级别,单机可以支撑,使用 ClickHouse
kifile
2019-08-28 18:04:33 +08:00
ps: 如果时序数据监控,influxdb 有一整套监控方案
kifile
2019-08-28 18:04:54 +08:00
就是开源版本不能分布式部署
Ley
2019-08-28 18:07:21 +08:00
可以看一下 Microsoft Azure HD Insights,他的文档里介绍了一些解决方案

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/595867

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX