mysql 分表能带来哪些显著的，可见的提升？

前提：
1 、未分库
2 、表 A 年数据量 1000w ，表 B 年数据量 5000w
3 、原业务中的 sql 涉及到 left join 查询，总是超时

两个表都使用 create_time 字段按月份分表 12 个，
在分表后，left join 的查询效率没有丝毫提升，
单表查询效率略微下降 (0.02 秒 > 0.05 秒)？

分表工具使用的是 mycat 以及 sharding-proxy （都有尝试）。

因为是第一次尝试 mysql 分表，所以很疑惑，分表带来的究竟是哪方面的提升？
还是说我的分表字段或者 sql 有问题

dobelee

2024-02-19 15:57:31 +08:00

啥场景？干掉 join ，关键字段冗余存储，或者组装数据。从业务的角度优化一下。

linauror

2024-02-19 15:58:43 +08:00

查询时带上时间条件了没，如果没带可能比单表效率还差。另外直接去数据库 explain 分析一下命中了索引没

fkdog

2024-02-19 16:00:34 +08:00

所以你有确定查询性能已经无任何可优化的手段后才决定分表，
还是瞄了了面经然后感性判断数据量大需要分表然后稀里糊涂的就拆了？

SJH0402

2024-02-19 16:02:28 +08:00

@linauror 带了，时间条件是范围索引，甚至有时候还会添加等值查询之类的条件进一步命中索引。哪怕是这样速度也是慢的出奇，几十上百秒是经常的

SJH0402

2024-02-19 16:06:13 +08:00

@fkdog 目前是单表 join 太慢，领导让分表试试，技术这块我只有执行权没有决定权

boks

2024-02-19 16:17:20 +08:00

单表查询 0.05 秒，left join 后几十上百秒？你用啥字段关联的，确定都有索引吗

SJH0402

2024-02-19 16:20:46 +08:00

@boks 一般来说是 left join 后使用 bigint 类型的 id 类字段进行关联，然后用 create_time 搭配 where 关键字进行范围过滤

select xxx from a left join b
on a.id = b.aid
where create_time between ... and ...