如何在group by中使用索引_mysql分组优化

来源:这里教程网 时间:2026-02-28 20:51:10 作者:

在 MySQL 中,

GROUP BY
能否高效使用索引,关键不在于“能不能用”,而在于“怎么写才让优化器愿意用”。索引对分组的加速效果,高度依赖字段顺序、是否覆盖、以及是否与
WHERE
条件协同。

确保 GROUP BY 字段是索引的最左前缀

MySQL 只能利用索引的最左前缀进行排序和分组。如果表有联合索引

INDEX (a, b, c)

GROUP BY a
GROUP BY a, b
GROUP BY a, b, c
可走索引(含隐式排序)
GROUP BY b
GROUP BY c
GROUP BY b, c
无法使用该索引做分组
⚠️
GROUP BY a, c
虽然含最左列,但跳过了
b
,索引只能用于
a
的过滤,
c
无法被索引有序性利用,分组仍需临时表

避免在 GROUP BY 字段上使用函数或表达式

任何对分组字段的计算都会导致索引失效:

GROUP BY YEAR(create_time)
—— 即使
create_time
有索引,也无法使用
GROUP BY UPPER(name)
—— 索引存储的是原始值,不是大写结果
✅ 若必须按年分组,可提前建生成列并为其加索引:
ALTER TABLE t ADD COLUMN create_year INT AS (YEAR(create_time)) STORED;

CREATE INDEX idx_year ON t(create_year);

然后写
GROUP BY create_year

让 WHERE + GROUP BY 共享同一索引(最有效策略)

当查询带条件又分组时,最优索引应满足:WHERE 过滤字段 + GROUP BY 字段(按顺序)构成连续最左前缀。

例如查询“2024年各品类销量总和”:

SELECT category, SUM(amount) FROM orders 
WHERE order_date >= '2024-01-01' 
GROUP BY category;

理想索引是:

INDEX (order_date, category)

这样 MySQL 可先用
order_date
快速定位数据范围,再按
category
顺序读取——天然满足分组需求,无需额外排序或临时表。

注意 SELECT 列是否需要回表(覆盖索引)

如果

SELECT
中包含非分组字段(如聚合外的普通列),或需要返回未索引字段,MySQL 可能放弃索引分组,转而用临时表+文件排序。

SELECT category, COUNT(*) FROM t GROUP BY category
—— 若有
INDEX(category)
,可仅靠索引完成
⚠️
SELECT category, MAX(title) FROM t GROUP BY category
—— 若
title
不在索引中,需回表查每组首条/末条记录,效率下降;此时建议建覆盖索引:
INDEX(category, title)

相关推荐