v 友们做大数据处理的多吗,想问下你们做大数据的无聊不?

2017-08-04 13:00:05 +08:00
 findbrick

反正本人已经做了半年了,感觉挺枯燥的,主要是 java + spark, 有时候也用 py 爬数据。

7244 次点击
所在节点    职场话题
32 条回复
Aksura
2017-08-04 22:45:31 +08:00
还好吧,其实主要的还是数据仓库那一套。不过数据本身类型更得更多样、时效性要求更高、加上 ML 的玩法,还是有搞头的。
lzhCoooder
2017-08-04 23:40:02 +08:00
同感觉挺无聊的,下次换工作准备转开发
airqj
2017-08-05 00:11:29 +08:00
@jason2017 例子源码就是最好的文档
要想理解算法可以用 scikit-learn 啊
pathbox
2017-08-05 00:46:25 +08:00
何为大数据
eyp82
2017-08-05 01:53:12 +08:00
其实现在大部分的所谓大数据岗位跟以前的数据仓库运维没多大区别. 写有限的几行代码 或者脚本, 配置一下 data pipeline, 搞搞 map, reduce 之类有限的几个算子(现在的 spark 还稍微多一些), 用现成的 ML 库灌点数据训练一下, 发现效果跟预期不符然后东搞搞西搞搞, 调调优(还没有方法论支撑,全自己或网上找的黑魔法), 弄点大家都知道的结论放 ppt 上吹嘘一下大数据多么神妙... 论创造性比不上正宗的软件开发, 只是最近流行, 所以看起来高大上一点而已.

我编不下去了, 我坦白就是想赚铜币, 大家别拍.
bbx
2017-08-05 02:00:31 +08:00
如果觉得简单,那是数据量太小,系统太简单
jason2017
2017-08-05 10:17:31 +08:00
@eyp82
瞎说什么大实话
lcj2class
2017-08-06 06:41:13 +08:00
可以多去了解整个系统。
比如 ETL 流程,工作流调度框架,血缘关系分析
findbrick
2017-08-06 16:32:30 +08:00
@af463419014
这就有些初级了吧
FollowHeart
2017-08-10 08:39:44 +08:00
@pathbox 就是以前人口中的统计 /滑稽
pathbox
2017-08-10 12:43:03 +08:00
@FollowHeart 哈哈
peterpan235
2018-05-24 21:35:07 +08:00
所以呢?做前端后台每天写一些重复的业务代码不无聊?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/380398

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX