数据库查询优化到底该怎么做？

#### 配置参数前提

目前数据库是 MySQL5.7
服务器内存 16g
单表数据 1G
数据行数 200W 的数据
当年的数据截止目前为止大概在 50W
表数据是订单和订单详情清洗后的数据。
业务要求统计一年内产生的订单相关信息

#### SQL

```sql
select [指定的一些业务数据需要字段，含一个字段 sum 求和并除以 1000000 单位转换] from t_order_stats where is_collec = 0
where is_collect=0 and pro_removal_time between '2024-01-01 00:00:00' and '2024-09-05 23:59:59' group by order_id
-- 就这样的查询在没有缓存的情况下就需要 6818ms
-- 至于为什么没带其他条件是想的直接拿出来代码里面全部去分类分组去求。
```

### explain 计划

| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
| ---- | ----------- | ------------- | ----- | ------------------------------------------------------------ | -------------------------- | ------- | ------- | ---- | ----------- |
| 1 | SIMPLE | t_order_stats | index | t_order_comprehensive_coverage_IDX, t_order_stats_order_id_IDX, t_order_trans_idx | t_order_stats_order_id_IDX | 8 | 2007971 | 50 | Using where |

`t_order_stats_order_id_IDX` 索引只有 `order_id`

#### 疑惑

is_collect 没有辨识度只有 0/1
哪怕是加上 limit 1 也异常慢

所以这种查询到底如何去处理，因为做的是大屏幕展示的，很多的数据都是时间条件查询。

那到底要去如何优化才能处理好这类查询。

看到别个百万千万上亿查询都洒洒水。实在想不通。

至于数据库配置内存已经是升级过一轮了。加不了一点

redog

130 天前

表里有主键吗？把主键去掉，建立一个，按 is_collect ，pro_removal_time ，id 的 UNIQUE 索引，这样应该会形成聚簇索引，第一次创建时因为你已经有 200W 的记录了，会对这 200W 记录重新物理排序，所以会很慢，另外就是插入和更改 is_collect 时会慢一点，但这个数据量来看应该不会有太大感知。
好处是会按上面的顺序物理排序，这样你前面的条件一出，回表取值的速度会大大加快，捞数据是顺序读取的。
另外一种就是建一个覆盖索引，按你之前的条件，前面必须是 is_collect ，pro_removal_time ，id ，然后继续跟所需要的业务字段，那个求和的也要算进来。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1070265