我们一个交易表,数据量比较大(一个星期大概有 2000W 的新数据)。现在老板想让我们对这个表做个分区,增加一下性能。没办法被赶鸭子上架,大概看了一下手册后,以周为单位,按时间设计了这样的分区结构:
CREATE TABLE t_o2o_dm (
id bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '订单编号',
device_id int(10) unsigned DEFAULT NULL COMMENT '设备编号',
dt datetime NOT NULL DEFAULT '0000-00-00 00:00:00' COMMENT '上传时间',
PRIMARY KEY (id,dt),
KEY IDX_DT (dt),
KEY IDX_DEVICE_ID (device_id),
) ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC
PARTITION BY RANGE (YEARWEEK(dt))
(PARTITION p1 VALUES LESS THAN (201901) ENGINE = InnoDB,
.......
PARTITION p52 VALUES LESS THAN (201952) ENGINE = InnoDB,
PARTITION p53 VALUES LESS THAN MAXVALUE ENGINE = InnoDB);
第一问题是:在进行测试时,我发现使用这样的查询语句:
EXPLAIN PARTITIONS SELECT * FROM t_o2o_dm WHERE dt BETWEEN "2019-03-10 00:00:00" AND "2019-03-10 23:59:59" 竟然无法过滤分区,每次查询都会把所有分区都扫描一次。可是按官网描述优化器应该根据 dt 列直接将查询范围固定到特定的分区才对。下面是这条语句 explain 的执行结果:
另一个就是,执行下面这样的查询语句时:
SELECT * FROM t_o2o_dm WHERE dt BETWEEN "2019-03-11 00:00:00" AND "2019-03-11 23:59:59" AND device_id = "382414"。查询效率竟然比不分区还慢一倍。
有没有做过表分区的老哥来介绍下经验啊,我百度谷歌找了半天全是几篇一样的文章,都是从 mysql 官方手册和高性能 mysql 上粘过去。很无奈啊
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.