使用 count(*) 统计后的字段作为 order by 的字段怎么优化

2019-10-11 15:58:19 +08:00

ShutTheFu2kUP

四百万行数据，GROUP BY 后统计，然后 DESC 排序后，还要分页

LOG( 统计该用户操作的日志表 )

id 主键
user_id 用户 ID
date 创建日期

SQL( date, user_id 这两个字段建立复合索引 )

SELECT
    user_id,
    count(*) AS count
FROM
    log
GROUP BY
    date, user_id
ORDER BY
    date DESC, user_id DESC
LIMIT 0, 10

以上 SQL 语句可以走索引，但是这时候如果要 count 字段进行排序，explain 就走全表了，执行了 1 分半，有其他办法优化吗？

SELECT
    user_id,
    count(*) AS count
FROM
    log
GROUP BY
    date, user_id
ORDER BY
    count DESC, date DESC, user_id DESC
LIMIT 0, 10

9495 次点击

所在节点

MySQL

10 条回复

setsunakute

2019-10-11 16:19:12 +08:00

select `user`, count from (
SELECT
`date`,
user_id,
count(*) AS count
FROM
log
GROUP BY
date, user_id
) as a
order by count DESC, `date` DESC, user_id DESC limit 0, 10;
这样试试?

ShutTheFu2kUP

2019-10-11 16:29:13 +08:00

@setsunakute 貌似还是一个结果，子查询不走索引，我启动强制索引，虽然 explain 的 key 有索引，但是还是 row 还是全表的行数

ShutTheFu2kUP

2019-10-11 16:50:08 +08:00

是我自己傻了...子查询还是走索引的，只是因为子查询里没有 LIMIT，所以行数还是全表的行数...

reus

2019-10-11 16:55:23 +08:00

不走全表，是没可能算出结果的，你怎么优化都不能违背基本逻辑。
可以给 date 加范围条件，如果业务允许的话。

ShutTheFu2kUP

2019-10-11 16:58:10 +08:00

@reus 是的..在不重构表的情况下我也只能想到这个方法了..

saulshao

2019-10-11 17:48:00 +08:00

这种我之前的办法都是把 count 结果直接写到表里....然后查询这个表...

zhengwhizz

2019-10-11 20:37:55 +08:00

首先要确认你的业务场景，从语句来看只是要知道用户每天的操作次数，这其实属于数据统计了，你的日志表为原始数据表，每次请求都去拿原始表肯定很慢，所以要建立一个统计表(userid, count, date )，然后在每次用户有操作时 count 加 1 （实时性要求高的情况），或者定时脚本把前一天的统计了放进去。这种设计还可以满足时间段的统计，只需要 sum 下即可。

Caballarii

2019-10-11 20:40:53 +08:00

redis

Leigg

2019-10-11 20:46:51 +08:00

兄 die，你是要全表排序啊，怎么避免扫全表。需求，表设计，库选择，总有一个是有问题的。
非要在现有的基础上解决这个问题，楼上的建议是不错的。

ShutTheFu2kUP

2019-10-12 11:20:36 +08:00

@zhengwhizz 嗯，谢谢大佬，我的思路也是如果重构就用字段+1 的方式。定时统计也是一种解决办法，之前没有想到，感谢指导

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/608277

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.