目前我总结的问题有以下几点: 1、数据采集(数据埋点,用 elasticsearch 收集埋点数据); 2、数据抽取(之前用存储过程,不易维护;也用过开源 ETL 工具,talend,效率低;现在用 python 脚本,成本较大) 3、数据整合(埋点数据和业务数据整合),数据存放在 mysql,目前没有用到数据仓库;
想知道大家在工作中会遇到哪些数据上的问题,一起探讨一下呀!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.