请教一下 clickhouse 的使用问题

2023-06-27 09:50:56 +08:00
 iamfenges
clickhouse 能作为 mysql 的从库吗?官网这个 MaterializedMySQL 引擎又写着是试验性的。你们是怎么使用的
3944 次点击
所在节点    MySQL
31 条回复
wxf666
2023-06-27 13:03:09 +08:00
@weijancc #20 好奇你原来的 SQL 是啥? 50W 数据量要 7 秒?
Frankcox
2023-06-27 13:05:38 +08:00
Clickhouse 的内存占用跟什么有关?我们有个单机 8C8G 的 Clickhouse ,里面有七八个表,两三个表有十几亿行,剩下的几千万行,日常任务都是很简单的单表根据 Time 间隔 Select ,看语句执行情况内存占用很少,只有几十还是几百 M ,但是 CPU 拉满了,且一般都是分钟级别查询。
xieshaohu
2023-06-27 13:41:25 +08:00
clickhouse 可以把 Mysql 表做外表,你想要分析方便,直接建立外表,然后 insert select 语法把数据快速导入到 clickhouse , 之后再基于 clickhouse 做聚合分析就行了。
zong400
2023-06-27 13:48:15 +08:00
@sadfQED2 flink 是做什么,kafka 不是能直接到 ck 吗
sadfQED2
2023-06-27 13:59:00 +08:00
@zong400 流式计算引擎,通过 flink 能够在插入前做各种处理,比如拼表,过滤某些字段等等
wu00
2023-06-27 14:30:49 +08:00
@iamfenges canal 也挺不稳定的,小项目用 docker 部署了一个单机版的用来监控 binlog ,隔三岔五的假死,翻遍了日志就是没有异常;有条件还是用云服务省心。
brader
2023-06-27 14:43:12 +08:00
可以的,但是我建议你 clickhouse 库只做数据统计用,不要用于强依赖数据一致性的业务。另外 clickhouse 库一定一定要分开专门的服务器来安装,因为 clickhouse 会极致利用服务器资源,和其他软件掺杂一起,可能会影响其他软件的运行。
自动同步数据的话,你可以看看这个项目,我觉得挺好用,主要是轻量
https://github.com/brokercap/Bifrost
v2orz
2023-06-27 14:53:23 +08:00
@ianEros #3
canal 不好用,维护更新少,建议换别的 CDC 方案,比如 flink CDC ,或者 DataX
vgbhfive
2023-06-27 20:43:50 +08:00
可以把数据实时同步到 ck ,然后 ck 做数据分析,我公司就是这么搞得,实时同步工具参考 clickhouse-mysql-data-reader
iluckypig
2023-06-27 23:02:26 +08:00
分析可以,业务不行。
lixintcwdsg
2023-06-27 23:02:58 +08:00
现在大部分公司就是这么用的,从 mysql binlog 那边同步入 CK
ck 就是个只读的从库

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/951954

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX