如题, 请教一下各位:
最近要设计一个准实时的数据流系统, 基本的功能是接受数据源发过来的数据, 做一些清洗转换, 转换成 MySQL 的数据表格式, 然后入库. 入库打算采用异步准实时的, 大概每隔一两分钟做一次批量插入数据库的操作.
请教大家, 这个时间间隔内接收到的数据, 怎么暂存(用什么库 /框架之类),会比较好一些, 现阶段暂时在考虑有没有比较简单的方案先跑起来再说; 另外如果以后要扩展, 要考虑可靠性(比如宕机尽量别丢消息)之类呢?
多谢大家.
1
afpro 2017-03-31 07:50:23 +08:00
看起来是 kafka 的菜?
|
2
kulove 2017-03-31 07:55:09 +08:00 via iPhone
redis kafka
|
3
WhoMercy 2017-03-31 08:34:35 +08:00 via Android
一分钟数据量不大可以放内存。
要宕机不丢数据,发送放得有重传机制,接收方得有持久化机制。各种消息队列+内存数据库,如 rocketMQ+Redis |
4
cjyang1128 2017-03-31 09:52:14 +08:00
flume + kafka + storm [滑稽
|
5
bk201 2017-03-31 10:17:34 +08:00
mq 就搞定了
|
6
eyp82 OP 谢谢大家, 最后用了某云服务的 message queue
|