最近工作遇到了一个需求需要设计一个类似通用的数据汇集平台,需要把用户配置的数据源(主要是 Oracle 和 MySQL )中的表以全量和定时增量的方式同步到本平台的数据库
目标数据源的表多的可能上亿条数据,同时平台需要向用户体现当前的同步任务进行的状态,主要是已同步的数据条数、本次同步新增数量、修改数量以及任务的完成情况这些的
由于本人对这大批量的数据没什么经验,目前想到的方式: 自己写代码用变更时间作增量字段来查询插入;这种方式的问题是全量同步时我该如何确认每次查询批次的数据条目数量不能太多,防止数据库压力太大或者 JVM 内存溢出?用数据库 limit 或者 rownum 来确认数量的话在千万或上亿的表中随着数量变大速度会越来越慢,感觉不是一个很好的方式。
思考了一下一时半会找不到合适的方式,所以来请教下 v2er 指点下有没合适的解决方案😂 感谢
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.