[数仓交流帖] 数仓职业交流贴

2023-04-16 10:53:11 +08:00
 comsweetcs

有搞数仓的老哥嘛?一起交流下?觉得这个职业能做一辈子嘛?离开了大厂,不需要了大数据的话,能干啥?我时常有这样的焦虑。

2999 次点击
所在节点    程序员
34 条回复
LeegoYih
2023-04-17 00:28:46 +08:00
我们公司数仓都被裁了大半了
lifanxi
2023-04-17 00:33:52 +08:00
俺们是做实时数仓产品开发的,让本来只能离线跑的 OLAP 查询实现 Ad Hoc 交互式地查询。虽然现在实时数仓不可能一下子替代传统的数仓,不过在很多场景下我们的实时数仓都能实现“一站式”的数据服务,让应用的开发更简单。有兴趣的同学欢迎来勾搭。
needpp
2023-04-17 01:20:47 +08:00
@Songxwn 同感
dayeye2006199
2023-04-17 07:14:53 +08:00
我之前做过一阵 reverse etl ,说实话,搞起来挺难的。对一致性,容错,性能都有很高的要求。
haimianbihdata
2023-04-17 08:11:10 +08:00
大数据没实权, 推不动业务侧改革。。。。裁员首选
xscit
2023-04-17 09:37:27 +08:00
是开发报表吗?
akira
2023-04-17 09:58:13 +08:00
茶树菇
comsweetcs
2023-04-17 10:18:59 +08:00
@haimianbihdata 这是很普遍的一个问题。
comsweetcs
2023-04-17 10:21:37 +08:00
@dayeye2006199 这和普通的 etl 有啥区别?你说的一致性、容错我理解基本都是技术层面的事。
comsweetcs
2023-04-17 10:22:07 +08:00
@xscit 哈哈哈哈,每个公司不一样,但是如果说开发报表,那就是应用层的事了。
comsweetcs
2023-04-17 10:22:37 +08:00
@LeegoYih 大佬啥公司,后端没裁?
comsweetcs
2023-04-17 10:24:37 +08:00
@lifanxi 看来我还是得转实时,还能写点代码。
dayeye2006199
2023-04-17 14:35:53 +08:00
@comsweetcs 逆向就是推数据从数仓到其他系统的 API 。比如同步产品数据到电商店铺里面去。

这个同步过程需要考虑挺多东西
如何记录状态,从而增量同步?
数据很多如何加快同步速度?
API 有限流,怎么在加快速度的同时不超过限流?
某几条数据同步失败了,重试和重试失败的策略是啥?
数据有重复怎么办?
comsweetcs
2023-04-17 14:42:36 +08:00
@dayeye2006199 以前我们是在应用层搞的,每个表生成一个全量和增量分区,第一次推全量后面推增量。把多条数据合并成一条消息,走 kafka 同步给业务系统。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/932875

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX