mysql2ch,一个同步 MySQL 数据到 ClickHouse 的项目

2020-03-19 21:16:35 +08:00
 jenlors

不久之前发布了初代版本的帖子,https://www.v2ex.com/t/647495#reply5,经过一段时间的升级之后,mysql2ch 升级到了 2.0 版本,功能更完善,跪求各位 star~👉mysql2ch


mysql2ch

Introduction

mysql2ch is used to sync data from MySQL to ClickHouse.

Requirements

Usage

Full data etl

$ python manage.py etl -h

usage: manage.py etl [-h] --schema SCHEMA --tables TABLES [--debug]

optional arguments:
  -h, --help       show this help message and exit
  --schema SCHEMA  Schema to full etl.
  --tables TABLES  Tables to full etl,multiple tables split with comma.
  --debug          Display SQL information.

Continuous Sync

  1. cp .env.example .env and edit it.
  2. edit docker-compose.yml,which will read .env,add your own consumer.One consumer consume one kafka partition.
  3. docker-compose up -d.

Optional

3073 次点击
所在节点    Python
5 条回复
ericFork
2020-03-20 06:28:04 +08:00
解析 binlog 往 kafka 里填的部分是自己实现的么?
jenlors
2020-03-20 09:27:45 +08:00
不是,只需要配置好就行了。
jenlors
2020-03-20 09:27:58 +08:00
ericFork
2020-03-20 17:10:28 +08:00
@long2ice #2 哦,我的意思是,是你自己造的轮子么?我们是类似的流程,postgresql -> kafka -> clickhouse,不过 postgresql -> kafka 这一步是用 debezium 达成的
jenlors
2020-03-20 20:04:55 +08:00
@ericFork 哦哦,借助了 python-mysql-replication 解析 binlog

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/654385

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX