GROUP BY 后必须出现 SELECT 中的所有非聚合字段
MySQL 8.0.13+ 默认启用
sql_mode=ONLY_FULL_GROUP_BY,这意味着如果
SELECT列表里有非聚合字段(比如
name、
status),它必须出现在
GROUP BY子句中,否则报错:
Expression #1 of SELECT list is not in GROUP BY clause。
常见错误写法:
SELECT id, name, COUNT(*) FROM users GROUP BY status;
这里
id和
name既没聚合也没分组,直接报错。解决方式只有三种: 把
id和
name加进
GROUP BY(但通常语义不合理) 用聚合函数包裹,如
MAX(name)、
MIN(id)临时关闭
ONLY_FULL_GROUP_BY(不推荐,掩盖逻辑问题)
HAVING 和 WHERE 的区别不能只记“过滤时机”
WHERE过滤行,
HAVING过滤分组 —— 这句话没错,但容易忽略关键约束:
HAVING只能引用
SELECT中的列或聚合表达式,不能引用原始表字段(除非该字段也在
SELECT或
GROUP BY中)。
例如以下写法会报错:
SELECT status, COUNT(*) FROM users GROUP BY status HAVING created_at > '2023-01-01';
因为
created_at没出现在
SELECT或
GROUP BY中,
HAVING看不到它。正确做法是: 改用
WHERE提前过滤:
WHERE created_at > '2023-01-01' GROUP BY status或把
created_at加入
GROUP BY(但通常会导致分组过细) 或用聚合函数,如
HAVING MAX(created_at) > '2023-01-01'
ORDER BY 在 GROUP BY 后的行为很实际
分组后默认不保证顺序,即使你写了
GROUP BY x,结果集顺序仍可能随 MySQL 版本、索引、执行计划变化。必须显式写
ORDER BY才能稳定排序。
注意两个细节:
ORDER BY可以直接用
GROUP BY字段名,也可以用别名(如
SELECT status AS s, COUNT(*) c GROUP BY status ORDER BY s) 如果
SELECT里用了聚合函数,
ORDER BY也能直接写函数,比如
ORDER BY COUNT(*) DESC,无需别名 MySQL 允许
ORDER BY引用未出现在
SELECT中的字段,只要它在
GROUP BY里(但其他数据库如 PostgreSQL 不允许)
GROUP BY NULL 是个冷门但有用的技巧
GROUP BY NULL会让整张表聚合成一行,常用于快速统计总数或判断是否存在数据:
SELECT COUNT(*), MAX(updated_at), MIN(created_at) FROM logs GROUP BY NULL;
它等价于去掉
GROUP BY,但显式写出更清晰地表达了“全表聚合”意图。注意它和
SELECT COUNT(*) FROM logs的执行计划通常一致,但如果你还要同时取多个聚合值(比如最大/最小时间),
GROUP BY NULL更直观。
另一个典型场景是配合
IFNULL做空值兜底:
SELECT IFNULL(AVG(score), 0) AS avg_score FROM exam_results GROUP BY NULL;
避免空表时返回
NULL行,而是确保总有一行数值结果。
真正难的是理解哪些字段该放进 GROUP BY、哪些该聚合——这取决于业务语义,不是语法能自动推导的。一个字段是否“天然属于分组维度”,得看它是不是每个分组内都唯一或稳定。别依赖
ANY_VALUE()来绕过检查,那只是把问题往后拖。
