多表查询本质是笛卡尔积 + 条件过滤,不是集合运算
MySQL 的
JOIN(包括
INNER JOIN、
LEFT JOIN等)**不属于数学意义上的集合运算**(如并集
UNION、交集
INTERSECT、差集
EXCEPT)。它底层先生成笛卡尔积,再用
ON或
WHERE做行级筛选——这是**关系代数中的“连接”(Join)操作**,和集合的“并/交/差”有根本区别。
容易混淆的点在于:
UNION才是真正的集合运算(要求列数、类型兼容,自动去重),而
JOIN是横向拼接字段,结果列数 = 左右表列数之和(除非显式选列)。
为什么不能把 JOIN 当成交集或并集来理解
拿
INNER JOIN举例:它看起来像“交集”,但实际逻辑完全不同:
SELECT * FROM A INNER JOIN B ON A.id = B.a_id:返回的是满足关联条件的**行组合**,每行包含 A 和 B 的字段(如
A.id, A.name, B.a_id, B.value) 而集合交集
SELECT id FROM A INTERSECT SELECT a_id FROM B:只返回一个字段(
id),且值必须在两表中都存在,不带任何其他属性 若 A 中某
id在 B 中匹配到 3 行,
INNER JOIN会返回 3 行;但
INTERSECT仍只返回 1 个
id
真正属于集合运算的 MySQL 操作有哪些
MySQL 支持的原生集合运算只有:
UNION/
UNION ALL:合并两个结果集(列数、类型需一致),
UNION去重,
UNION ALL不去重
INTERSECT:MySQL 8.0.31+ 才支持(旧版本需用
INNER JOIN模拟,但语义不同)
EXCEPT:MySQL 不支持(需用
LEFT JOIN ... WHERE right.col IS NULL模拟)
注意:
UNION要求左右查询的字段数量、顺序、类型兼容;而
JOIN完全不要求字段对应,只依赖关联条件。
实战中容易踩的坑:把 JOIN 条件写在 WHERE 里导致外连接失效
这是新手高频错误。例如想查「所有部门及下属员工(含无员工的部门)」,正确写法是:
SELECT d.name, e.name FROM dept d LEFT JOIN emp e ON d.id = e.dept_id;
但如果把关联条件错写进
WHERE:
SELECT d.name, e.name FROM dept d LEFT JOIN emp e ON d.id = e.dept_id WHERE e.salary > 5000;
结果会变成「有员工且工资>5000 的部门」——
WHERE会在连接后过滤,把
e.salary为
NULL的行(即无员工的部门)全干掉了,
LEFT JOIN形同虚设。
正确做法:把过滤条件移到
ON子句(仅适用于被驱动表的条件):
SELECT d.name, e.name FROM dept d LEFT JOIN emp e ON d.id = e.dept_id AND e.salary > 5000;
关系型数据库里的“连接”是行与行之间的配对逻辑,不是集合元素的归属判断;理解这点,才能避开绝大多数 JOIN 语义误用问题。
