大数据量优化

49 天前
 young1
各位大佬,我主要干 GIS 领域,然后现在做一些地质类的项目的时候,就碰到了一个问题:
一个项目做勘察,可能有很多个钻孔,然后每个钻孔会有很多信息,存储不同的表。然后如果遇到做项目归档成果导出类似的需求的时候,就需要根据项目吧所有钻孔信息做整合生成报表。怎么样做才能使效率最高化,还不容易出错。( JAVA 仔)
1307 次点击
所在节点    程序员
7 条回复
NikoXu
49 天前
spring data jap 的 entity 支持继承吧 , 可以把公共的字段放在父表里面
7911364440
49 天前
平铺吧,表越多就越复杂,效率也越慢
spritecn
49 天前
不 join 的话,内存够的话,还是很快的吧,不行就提前全推给 ES,再拉出来
Meld
49 天前
我理解也不是很常调用的业务,每天凌晨跑个定时任务生成下聚合报表,需要的时候直接读这个报表就行了吧
young1
49 天前
@Meld 现在也是用的后台任务去执行,但是数据有可能会发生改变,而且客户更期望的是通过接口直接返回 ZIP 结果进行下载那种效果
Meld
49 天前
@young1 哦,那确实需要实时聚合下,数据量级大概是多大的?看起来数据量不大,只是拆的表比较细?
sampeng
48 天前
导出报表是数据分析的活。数据量看有多大,笛卡尔积如果超过十亿。就应该上 clickhouse 之类的宽表服务

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1087449

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX