要做一些复杂的数据统计 MySQL 里的数据如何同步到 HBase?

2015-12-27 17:08:59 +08:00
 BeanYoung
举个简单的例子, MySQL 里有订单相关的数据,要对订单做统计分析,订单的变化希望能半实时的同步到 HBase ,然后用 spark 来做统计分析。

怎么比较好的将 MySQL 里的数据变化同步到 HBase 里?大家有什么比较好的方法吗?

能想到的一个方法就是在需要同步的表增加一个 update_time 字段,给 update_time 加索引,用一个脚本将最近更新的数据同步到 HBase 。
913 次点击
所在节点    数据库
2 条回复
sleepNULL
2015-12-27 20:44:42 +08:00
用一些 binlog 抽取的中间件来做吧
morefreeze
2015-12-28 11:20:32 +08:00
同意 LS , github 可以搜一些 binlog 中间件去自己转成想要的格式存到 HBase 里,比如阿里的叫啥忘了
或者 hadoop 自带的 sqoop(2) 这个是个命令行,可配置的相对少点,也能直接导入 HBase ,但定制性肯定没上面的好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/246481

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX