咨询个 hbase 的订单路由问题

2020-07-16 14:20:35 +08:00
 Ministor
假设某个公司的订单 10 年达到 100 个亿的数据,存在 hbase 里面
1.创建一张表,散列到 100 个分区,rowkey 是按照 userid 进行散列
2.创建 10 张表,每个表有 10 个分区,这 10 个表是按照订单的创建时间每年来划分的,rowkey 是按照 userid 进行散列

如果用方案 1,那么这张表会不会显得大,因为最近一年的订单访问会比较频繁,一年前的数据访问不那么频繁,有没有那种浪费的感觉

如果用方案 2,最近一年那个表会不会出现热点问题,可以把一年前的订单用机械磁盘存,最近一年用 ssd 存储,保证 99rt,且降低成本

目前存在的疑惑就是 方案 2 会不会出现热点问题,因为方案 1 的话,感觉会路由到不同的分区,会减少热点的概率

对 hbase 还不是太熟悉,求指教一下
943 次点击
所在节点    程序员
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/690572

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX