公司的数据量越来越大了

2019-07-01 18:28:19 +08:00
 v2eb

一张 mysql 主表有三千万数据量,这才刚开始,后期数据量会更多,v 友有什么建议吗

9589 次点击
所在节点    程序员
46 条回复
guokeke
2019-07-01 18:36:26 +08:00
你预期后期数据量每天什么规模?
guokeke
2019-07-01 18:36:38 +08:00
以及说下业务呗
mokeyjay
2019-07-01 18:39:35 +08:00
无非是分库分表、或者上非关系型
v2eb
2019-07-01 18:40:11 +08:00
@guokeke 三天从 500 万到 3 千万,
目前只是做普通的数据展示,
以后可能会有数据分析啥的,咱也不懂
v2eb
2019-07-01 18:40:50 +08:00
公司有人提到要用 ES
tt67wq
2019-07-01 18:42:09 +08:00
删苦跑路吧!!!
swulling
2019-07-01 18:42:44 +08:00
三天这个量,只能放弃关系数据库了
guokeke
2019-07-01 18:46:02 +08:00
@v2eb 如果数据有时间相关性可以按照天或者月分表,无时间相关就要根据业务来分析了,粗暴点可以按照常用查询的列的值的 hash 进行分表。
gaoyulong
2019-07-01 18:48:01 +08:00
看业务啊,不说具体要求就是耍流氓
txy3000
2019-07-01 18:51:12 +08:00
以后还会有每天 1000w 的增量吗? 会的话索引更新很频繁 单机承载不了的 上分布式吧 sharding 负载均衡那一套
如果查询还多 Redis 也得上 缓存热点数据 减轻数据库 IO
如果并发还高 建议上消息队列 异步插入
neptuno
2019-07-01 18:51:13 +08:00
是不是表设计有问题?
Solarest
2019-07-01 18:51:25 +08:00
热数据分库分表,冷数据进数仓
icekingcy
2019-07-01 18:53:41 +08:00
就是些流水数据吧? 换 ES 吧
v2eb
2019-07-01 18:55:26 +08:00
感觉 DBA 有点水,字段大小随意设
chenqh
2019-07-01 19:33:15 +08:00
一天 1kw 的数据公司应该很有钱
rrfeng
2019-07-01 19:46:09 +08:00
单表十二亿路过
janus77
2019-07-01 19:51:11 +08:00
这个增量速度,怕是需要搞冷热分库吧
你千万级别用作数据展示 都放出来?不太可能吧,最多就是把计算结果再存一个表而已。计算任务应该是定时跑的,这个不需要多高的实时性
vZexc0m
2019-07-01 23:14:04 +08:00
持续增长,上 tidb 得了。
airfling
2019-07-01 23:25:42 +08:00
上 es 吧,一天几个 g 的数据都不怕,反正你也只是展示数据,es 分好索引完全没问题
Takamine
2019-07-01 23:30:09 +08:00
ETL。(。ò ∀ ó。)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/579045

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX