kex0916's recent timeline updates
kex0916

kex0916

V2EX member #238839, joined on 2017-07-05 14:48:46 +08:00
Per kex0916's settings, the topics list is hidden
Deals info, including closed deals, is not hidden
kex0916's recent replies
把文件合并下,或者把读取文件过程拆分成多个任务跑,最后再 union 起来
可以先将大文件解压缩后放到 hdfs 上后再做计算,或者可以试试 https://github.com/nielsbasjes/splittablegzip 这种
邀请码:nlb4o8
Apr 18, 2019
Replied to a topic by blackcurrant 程序员 上百亿个键值对使用什么数据库好?
hbase
@qiuyesuifeng 我看官网上大数据岗位在北京,成都有岗位吗?
@leechow 好的,谢谢
老哥可以帮推大数据的吗
Feb 20, 2019
Replied to a topic by casillasyi 程序员 最近在准备弃了 Java ,入 Clojure 的坑
可以试试 scala 瑟
你要找应用真正停止的原因,是正常执行完还是遇到了错误
ERROR scheduler.LiveListenerBus: SparkListenerBus has already stopped! 这个应该是 SparkContext 停止引起的,java.io.IOException: Broken pipe 这个要看看调用栈
数据的话你可以重新跑这个任务吗,计算一下条数什么的比较一下
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5095 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 09:28 · PVG 17:28 · LAX 02:28 · JFK 05:28
♥ Do have faith in what you're doing.