在MySQL中使用DISTINCT关键字可以去除查询结果中的重复行,只返回唯一的数据记录。它通常放在SELECT后面,用于对一个或多个字段进行去重处理。
DISTINCT的基本用法
当你只想获取某列的唯一值时,可以直接在字段前加上DISTINCT:
SELECT DISTINCT column_name FROM table_name;例如,有一个用户表user_table,其中city字段有重复数据:
SELECT DISTINCT city FROM user_table;这条语句会返回所有不重复的城市名称。
对多列进行去重
DISTINCT作用于多个字段时,会将这些字段的组合值视为整体,只有当所有指定字段的值都相同时才会去重:
SELECT DISTINCT column1, column2 FROM table_name;比如查询不同用户的姓名和城市组合:
SELECT DISTINCT name, city FROM user_table;即使name相同,只要city不同,就会作为两条独立记录保留。
结合聚合函数使用DISTINCT
DISTINCT也可以用在聚合函数中,如COUNT、SUM等,用于统计唯一值的数量:
SELECT COUNT(DISTINCT city) FROM user_table;这句查询将返回user_table表中不重复城市的总数。
如果想查看每个部门中不同岗位的数量,可以这样写:
SELECT department, COUNT(DISTINCT job_title) AS unique_jobs FROM employee_table GROUP BY department;注意事项
DISTINCT会对性能有一定影响,尤其是在大数据量表上操作时。数据库需要排序或哈希处理来识别重复项,因此建议:
仅在必要时使用DISTINCT 确保相关字段上有适当索引 避免在大文本字段(如TEXT类型)上使用DISTINCT 注意NULL值也会被当作一种值参与去重基本上就这些。DISTINCT是简单有效的去重工具,合理使用能让查询结果更清晰准确。
