问一个问题: Hbase,大量数据下(几千万条),能否根据某个 Column 值的大小进行排序并取出前数条。

2016-07-20 16:33:01 +08:00
 parcuse
语言是 python ,如果有 Java 的实现思路也可以。
6640 次点击
所在节点    Python
2 条回复
wander2008
2016-07-20 18:46:06 +08:00
可以。 mapruduce 可以。 hbase 本身也可以的
firstway
2016-07-22 09:40:57 +08:00
HBase 本身不行, HBase 是按 raw key 排序的,不会理会 column 排序。
楼上说 MapReduce 可以( MapReduce 不是 HBase 一部分,只是很容易集成),是可以的,本质上是 scan 所有数据,读出数据,然后以你指定的 column 值为 key 排序。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/293735

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX