DISTINCT 是 MySQL 中用于去除查询结果中重复行的关键字,它作用于整行数据,而不是单个字段。只要两行在 SELECT 列表中的所有列值完全相同,就会被当作重复行,只保留其中一行。
基本语法:SELECT DISTINCT 字段列表
最常用的形式是紧跟在 SELECT 后面使用 DISTINCT:
SELECT DISTINCT name FROM users; —— 去重单个字段(返回不重复的姓名) SELECT DISTINCT city, province FROM addresses; —— 去重组合字段(只有 city 和 province 都相同时才视为重复) SELECT DISTINCT * FROM orders WHERE status = 'shipped'; —— 对满足条件的完整记录去重DISTINCT 的作用范围是整行,不是单列
很多人误以为 SELECT DISTINCT name, age FROM people; 是分别对 name 和 age 去重,其实不是。它表示“name 和 age 的组合”唯一。例如:
(张三, 25) 和 (张三, 28) 是两条不同记录,都会保留 (李四, 30) 出现两次,则只取一次如果只想获取不重复的 name,但又想顺带查出某个对应的 age(比如最小或最大),需要用 GROUP BY 或窗口函数,不能靠 DISTINCT 实现。
DISTINCT 和 ORDER BY、LIMIT 的配合
DISTINCT 可以和排序、分页一起用,但注意顺序:
SELECT DISTINCT category FROM products ORDER BY category LIMIT 5; —— 先去重,再按字母排序,取前5个 ORDER BY 的字段必须出现在 SELECT 列表中(除非启用了 ONLY_FULL_GROUP_BY 模式外的宽松模式) LIMIT 在 DISTINCT 之后生效,即先得到去重后的完整结果集,再截取性能提醒:DISTINCT 可能影响查询速度
MySQL 实现 DISTINCT 通常需要临时表或排序操作,尤其在大数据量、多字段组合去重时:
确保参与 DISTINCT 的字段上有合适索引(如联合索引覆盖 SELECT 列表) 避免对无意义的全字段(SELECT DISTINCT *)去重,尽量明确列出需要的列 如果只是判断“是否存在”,可用 EXISTS 替代 SELECT DISTINCT ... LIMIT 1