大文件排序问题

2017-12-18 20:33:46 +08:00
 kaiser1992
现在有一个文本,包括 5000W 行,每行由拼音+ID 组成,现在要求按照拼音字母的顺序把这个文件进行重新排序。
V 友们有什么想法呢?支个招~
2039 次点击
所在节点    程序员
5 条回复
owenliang
2017-12-18 20:44:36 +08:00
外排序呗 还能咋地
BBCCBB
2017-12-18 20:58:20 +08:00
读出来,放 redis 里,用 redis 排序,
kaiser1992
2017-12-19 09:38:23 +08:00
@owenliang 字符串排序,略显慢啊
gouchaoer
2017-12-19 10:22:03 +08:00
插入数据库,加上索引,然后通过 a~z 的顺序 select 出来
gouchaoer
2017-12-19 10:30:50 +08:00
导入 hive,然后 select 出来

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/415779

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX