v 友们做大数据处理的多吗,想问下你们做大数据的无聊不?

2017-08-04 13:00:05 +08:00
 findbrick

反正本人已经做了半年了,感觉挺枯燥的,主要是 java + spark, 有时候也用 py 爬数据。

7273 次点击
所在节点    职场话题
32 条回复
Morriaty
2017-08-04 13:15:13 +08:00
无聊不至于,就是真正懂算法的不多,公司里号称大数据部门,其实大部分人都是写 sql 的。

更多的时候,就是自己一个人在瞎摸,就像解一道数学题,从太阳上山到太阳下山,都没解出来,难受。
xiaoshenke
2017-08-04 13:32:20 +08:00
跑个题,写过 android,写过 java web,都写得差不多腻了。看来我不适合做程序员。
jason2017
2017-08-04 13:37:15 +08:00
顺便请假题主一个问题,java 写 spark 机器学习应用的时候,用 mllib 多还是 ml 多?哪一个方便点?
deadEgg
2017-08-04 14:13:48 +08:00
@jason2017 试试 BigDL
zhangli199212
2017-08-04 14:20:28 +08:00
@Morriaty 一看就是券商类似的
findbrick
2017-08-04 15:57:00 +08:00
@jason2017 mllib
findbrick
2017-08-04 15:58:04 +08:00
@zhangli199212 是金融行业 非券商
findbrick
2017-08-04 16:17:49 +08:00
@Morriaty 有道理 主要还是自己摸索 算法确实是硬伤
sshpandas
2017-08-04 16:23:49 +08:00
不无聊,因为经常换项目做,接触的行业不一样,问题也不一样。
staticor
2017-08-04 17:12:55 +08:00
不无聊, 自己喜欢和业务打交道, 现在一半时间做仓库一半时间做分析
findbrick
2017-08-04 17:39:56 +08:00
@sshpandas 羡慕经常换项目
@staticor 基本都是仓库+分析 一起做
sicongwang
2017-08-04 19:43:45 +08:00
楼主大数据是不是不算忙, 待遇也比开发高, 想转, 求指教
af463419014
2017-08-04 20:02:38 +08:00
我这里所有的需求总结起来主要有以下 3 种:
sum(x)
count(id)
count(distinct id)
lszv1
2017-08-04 20:24:21 +08:00
@xiaoshenke 给钱就继续干下去咯
airqj
2017-08-04 20:28:55 +08:00
@jason2017 ml 基于 DataFrame
人家文档都说 mllib 进入维护状态了
Delete
2017-08-04 20:32:34 +08:00
2-3 年安卓转大数据开发,一本 hadoop 权威指南 看得很累了。。。
sicongwang
2017-08-04 20:36:59 +08:00
@af463419014 需求真的有这么简单吗, 那大数据的工作做起来岂不是没有什么业务的压力?
badttt
2017-08-04 21:12:10 +08:00
sql 写得想吐,你说呢
jason2017
2017-08-04 21:17:05 +08:00
@airqj 是的,但是网上现在关于 ml 的中文资料还是不多,不过,也是迟早要用 ml 的。
liprais
2017-08-04 21:25:42 +08:00
@sicongwang
这工作只是看起来很简单而已

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/380398

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX