@
levelworm 举个例子。我是做数据开发的,现在业务需要做一个数据层(但是现实中,我其实也需要把 BI 做的 data modelling 和 dashboard 给做了),因此无非是找相关的 dim 表和 fact 表。业务很贴心地给了个 required fields ,按图索骥即可。
根据本人的经验,dim 表很好找,因为每个数据层几乎都是用到这么些 dimensions 。但是 fact 表由上游产出,那么质量就随机了。目前做的项目质量很差,是第三方导出的数据,上游做的无非就是把第三方的数据导出到一张全字符串的表中。所有的研究和过滤工作都交给我和业务协商。可想而知这有多痛苦了。业务能够从业务上讲清楚他们需要哪些数据,但是没有办法写表的过滤逻辑。我会写过滤逻辑,但是我也没法把业务直接翻译过来,而上游除了做了个 dump 之外,其他都需要转发给第三方,这个速度可想而知。
所以我现在是不高兴做这些东西了。我想挪到上游去。看起来上游好混日子啊。。。