V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
BeanYoung
V2EX  ›  数据库

要做一些复杂的数据统计 MySQL 里的数据如何同步到 HBase?

  •  
  •   BeanYoung · 2015-12-27 17:08:59 +08:00 · 887 次点击
    这是一个创建于 3258 天前的主题,其中的信息可能已经有所发展或是发生改变。
    举个简单的例子, MySQL 里有订单相关的数据,要对订单做统计分析,订单的变化希望能半实时的同步到 HBase ,然后用 spark 来做统计分析。

    怎么比较好的将 MySQL 里的数据变化同步到 HBase 里?大家有什么比较好的方法吗?

    能想到的一个方法就是在需要同步的表增加一个 update_time 字段,给 update_time 加索引,用一个脚本将最近更新的数据同步到 HBase 。
    2 条回复    2015-12-28 11:20:32 +08:00
    sleepNULL
        1
    sleepNULL  
       2015-12-27 20:44:42 +08:00
    用一些 binlog 抽取的中间件来做吧
    morefreeze
        2
    morefreeze  
       2015-12-28 11:20:32 +08:00
    同意 LS , github 可以搜一些 binlog 中间件去自己转成想要的格式存到 HBase 里,比如阿里的叫啥忘了
    或者 hadoop 自带的 sqoop(2) 这个是个命令行,可配置的相对少点,也能直接导入 HBase ,但定制性肯定没上面的好
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1830 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 00:00 · PVG 08:00 · LAX 16:00 · JFK 19:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.