使用 count(*) 统计后的字段作为 order by 的字段怎么优化

2019-10-11 15:58:19 +08:00
 ShutTheFu2kUP

四百万行数据,GROUP BY 后统计,然后 DESC 排序后,还要分页

LOG( 统计该用户操作的日志表 )

id 主键
user_id 用户 ID
date 创建日期

SQL( date, user_id 这两个字段建立复合索引 )

SELECT
    user_id,
    count(*) AS count
FROM
    log
GROUP BY
    date, user_id
ORDER BY
    date DESC, user_id DESC
LIMIT 0, 10

以上 SQL 语句可以走索引,但是这时候如果要 count 字段进行排序,explain 就走全表了,执行了 1 分半,有其他办法优化吗?

SELECT
    user_id,
    count(*) AS count
FROM
    log
GROUP BY
    date, user_id
ORDER BY
    count DESC, date DESC, user_id DESC
LIMIT 0, 10
9495 次点击
所在节点    MySQL
10 条回复
setsunakute
2019-10-11 16:19:12 +08:00
select `user`, count from (
SELECT
`date`,
user_id,
count(*) AS count
FROM
log
GROUP BY
date, user_id
) as a
order by count DESC, `date` DESC, user_id DESC limit 0, 10;
这样试试?
ShutTheFu2kUP
2019-10-11 16:29:13 +08:00
@setsunakute 貌似还是一个结果,子查询不走索引,我启动强制索引,虽然 explain 的 key 有索引,但是还是 row 还是全表的行数
ShutTheFu2kUP
2019-10-11 16:50:08 +08:00
是我自己傻了...子查询还是走索引的,只是因为子查询里没有 LIMIT,所以行数还是全表的行数...
reus
2019-10-11 16:55:23 +08:00
不走全表,是没可能算出结果的,你怎么优化都不能违背基本逻辑。
可以给 date 加范围条件,如果业务允许的话。
ShutTheFu2kUP
2019-10-11 16:58:10 +08:00
@reus 是的..在不重构表的情况下我也只能想到这个方法了..
saulshao
2019-10-11 17:48:00 +08:00
这种我之前的办法都是把 count 结果直接写到表里....然后查询这个表...
zhengwhizz
2019-10-11 20:37:55 +08:00
首先要确认你的业务场景,从语句来看只是要知道用户每天的操作次数,这其实属于数据统计了,你的日志表为原始数据表,每次请求都去拿原始表肯定很慢,所以要建立一个统计表(userid, count, date ),然后在每次用户有操作时 count 加 1 (实时性要求高的情况),或者定时脚本把前一天的统计了放进去。这种设计还可以满足时间段的统计,只需要 sum 下即可。
Caballarii
2019-10-11 20:40:53 +08:00
redis
Leigg
2019-10-11 20:46:51 +08:00
兄 die,你是要全表排序啊,怎么避免扫全表。需求,表设计,库选择,总有一个是有问题的。
非要在现有的基础上解决这个问题,楼上的建议是不错的。
ShutTheFu2kUP
2019-10-12 11:20:36 +08:00
@zhengwhizz 嗯,谢谢大佬,我的思路也是如果重构就用字段+1 的方式。定时统计也是一种解决办法,之前没有想到,感谢指导

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/608277

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX