Java 下做数据分析

2017-12-05 14:15:47 +08:00
 jowuIM

本来想用 Python 的 pandas 来做一个数据分析,但是对 Python 不太感冒;
数据集不大,就是几十万行;
个人想用 hbase 存储然后用 ElasticSearch 实现来实现聚类等等功能,但是觉得有点大材小用;
想问问大家有什么其他的建议.

5362 次点击
所在节点    Java
3 条回复
TimePPT
2017-12-05 15:18:30 +08:00
如果数据量不太大,本地跑跑又图快速干活,个人还是建议用 python pandas 这套,java 好像没见到特别好的简单框架直接拿来用。

网上搜了下,有人推荐这个,没用过,仅供参考
https://github.com/jtablesaw/tablesaw
jowuIM
2017-12-07 22:20:34 +08:00
@TimePPT tablesaw 不太行,100w-300w 行的数据量还行,但是我试了 2300w 行的数据发现实在是太慢了。还是不得不用 pandas,但是对 python 不是很熟悉,文档看起来真心虐人。
TimePPT
2017-12-07 22:52:11 +08:00
@jowuIM 好吧,我一般都是 pandas 搞定的,java 反而不太熟

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/412147

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX