V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xinxingi  ›  全部回复第 1 页 / 共 2 页
回复总数  40
1  2  
@M4ster 我有一次 doris 的贡献。两次 dolphinscheduler 的贡献。这两项目都是 10k star 。目前我没有资格领取
https://imgse.com/i/pFtHL7T
@lianyue You made at least three commits to a repository that is one of the top 5,000 repositories worldwide, ranked by number of stars, before November 15th, 2023. At least one of these commits occurred during 2018 or later.

不是 2023 年 11 月 15 日之前 且 18 年之后吗。我英语不好,我目前是这么理解的。我这边提交了 ds 和 doris 的 commit 确实,我没资格领取
数据开发现状
我:这次换工作大概投了多少家,接到多少面试
我朋友:几百家,面试个位数,我个人感觉,有效面试不到 5 家,3 家这样

先列举大数据必知必会的几个组件给你 Spark(计算引擎)、Flink(计算引擎)、Datax(抽数工具只列举一种)、Hadoop(MR 引擎淘汰,大部分企业不用了,但你要会,这是大数据鼻祖了)、Hive(OLAP)、Clickhouse(OLAP)、Doris(OLAP)、DolphinSchduler(调度比较多只列举一种)、Iceberg 。就先围绕着这些学习吧,JAVA SE 、SCALA 必学,这两门语言在大数据领域很重要。python 会不会看你了,我反正没怎么学,工作中没用到主要。还有以前很火现在逐渐退出历史舞台的我没列举了,毕竟有更好的东西替代。

近几年 AI 崛起,大数据也要开始摸索 AI 在大数据的应用,这个都还没开始做或者刚开始做,但我估计只是时间问题。

基本的那些算法要会。

如果你偏向平台方向,你要会 spring

如果你偏向业务方向,你要会 BI(比较出名的 BI 报表国内有帆软等、国外 Apache 也有开源 Bi)。
261 天前
回复了 thebeacon 创建的主题 Java 提问一个用 Java 解析 JSON 的方法
@thebeacon 考虑到你的 json 格式不固定,那就简单粗暴一点。拿到原 json 后,把原 json 的 response. customerInfo.children 全部拿出来装入集合。清空原 json 中的 response. customerInfo.children.拿刚才的集合一个一个的全部遍历填充进去。结束
284 天前
回复了 fox0001 创建的主题 程序员 那些年,所弃坑的编程语言
@zydxn 这玩意真的要把备注写清楚
没事儿别瞎折腾 我 10600KF+5500XT 都折腾很久,你还想用 13 系的 U 玩黑苹果吗
2023-04-28 15:36:39 +08:00
回复了 sniperking1234 创建的主题 MySQL mysql 语句中 group by 的问题
上面两段是,gpt 的问答,我个人建议你直接用第一种方式。可读性比第二种高,性能也比第二种更好。如果把数据量计算在内的话,当数据量超出一定量时,直接移交数据部门(大数据)去做,这种分析对于 mpp 架构的数据库来说,小菜一碟 ,OLAP 数据库 干的活就别为难 OLTP 数据库了。
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2527 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 100ms · UTC 15:52 · PVG 23:52 · LAX 08:52 · JFK 11:52
Developed with CodeLauncher
♥ Do have faith in what you're doing.