clickhouse 有 200 多亿数据， 80 个字段，如何快速检索？

clickhouse 有 200 多亿数据，80 个字段，查询的场景是要在界面上展示明细数据，并且根据任一列进行检索。

想问下 clickhouse 在这种场景怎么设计比较好？我了解在 order by(a,b,c,d,...)这种，只有 where a=xxx 的时候查询比较快 b=xxx 或者 c=xxx 感觉是全表扫描，非常慢。

documentzhangx66

2022-04-25 00:44:09 +08:00

这种城市电信级的数据量，如果可以提前预处理，可以配几台洋垃圾集群，大概一两万一台的预算，用分布式算法，前一天晚上把第二天需要展示的数据，提前算好。第二天直接从集群以顺序读的方式展示数据，这样成本低一些。

但如果是要现场实时查询数据，可以考虑各大厂去年新出的全 nvme m.2 服务器，2U 顶配大概 200 多 W 一台，网口没记错的话应该是 100G 的，用这种服务器，虽然无法保证能秒级查询，但在可以忍耐的时间范围内，应该能出结果。

liprais

2022-04-25 00:55:54 +08:00

不做统计你用 ck 干啥
es 堆机器完事

dtgxx

2022-04-25 02:13:35 +08:00

@documentzhangx66 这有点昂贵了哈哈

@liprais 也需要统计，但是也要明细，不知道能不能用 clickhoise 实现

devinww

2022-04-25 09:50:03 +08:00

clickhouse 配合 es ，一个做分析，一个做搜索

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/849035

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.