mysql中的left join如何使用

来源：这里教程网时间：2026-02-28 20:08:28 作者：

LEFT JOIN

在 MySQL 中用于从两个或更多表中查询数据，它的核心作用是确保左表（

FROM

关键字后面的表）的所有行都被包含在结果集中，即使右表（

LEFT JOIN

关键字后面的表）中没有匹配的行。当右表没有匹配项时，结果集中来自右表的列会显示为

NULL

。这在我处理需要完整主数据，同时又想关联次要信息，但次要信息可能不全的场景时，简直是神器。

解决方案

LEFT JOIN

的基本语法是这样的：

SELECT column_name(s)
FROM table1
LEFT JOIN table2
ON table1.column_name = table2.column_name;

这里，

table1

是“左表”，

table2

是“右表”。

ON

子句定义了两个表之间如何关联的条件。

举个例子，假设我们有两个表：

users

(包含

user_id

name

) 和

orders

(包含

order_id

user_id

amount

)。我们想查询所有用户及其订单信息，即使有些用户从未下过订单。

SELECT
    u.user_id,
    u.name,
    o.order_id,
    o.amount
FROM
    users AS u
LEFT JOIN
    orders AS o ON u.user_id = o.user_id;

在这个查询中，

users

表是左表，

orders

表是右表。结果会包含

users

表中的所有行。如果某个

user_id

在

orders

表中没有对应的记录，那么结果集中

o.order_id

和

o.amount

这些列的值就会是

NULL

。这对我来说，是理解用户行为、发现“沉睡用户”的直接方式。

为什么LEFT JOIN在数据分析中如此关键？

在我看来，

LEFT JOIN

之所以关键，在于它能帮助我们完整地理解数据的全貌，尤其是在处理“主客体”关系时。想象一下，你正在分析一个电商平台的销售数据。如果你只用

INNER JOIN

来连接用户表和订单表，你只会看到那些有订单的用户。但如果你想知道所有注册用户的情况，包括那些注册了却从未购买的用户，

INNER JOIN

就无能为力了。

LEFT JOIN

允许我们保留左表的所有“主体”信息，比如所有用户、所有产品、所有文章，然后尝试将相关的“客体”信息（订单、评论、点赞）关联起来。即使客体信息缺失，主体信息也不会丢失。这种能力对于用户画像分析、产品覆盖率统计、内容触达效果评估等场景至关重要。它能让你看到“没有发生什么”的数据，这有时比“发生了什么”更有价值。比如，哪些用户是注册了但一直没下单的？这群人可能就是我们营销的重点对象。它提供了一种非侵入式的关联方式，不会因为右表数据的缺失而“过滤”掉左表的关键信息。

LEFT JOIN与INNER JOIN、RIGHT JOIN有什么区别，什么时候该用哪个？

这三者是 SQL 中最基础也是最常用的连接类型，但它们处理不匹配行的方式截然不同。说实话，刚开始学的时候我常常会混淆，但一旦理解了它们的核心逻辑，选择起来就清晰多了。

INNER JOIN
(内连接)：
作用：只返回两个表中都存在匹配的行。如果某个行在任一表中没有匹配项，它就不会出现在结果集中。 何时使用：当你只关心那些在两个表中都有对应关系的记录时。例如，你只想看那些下了订单的用户，或者只看有库存且有订单的产品。它的结果集是两个表的交集。例子：
SELECT * FROM users INNER JOIN orders ON users.user_id = orders.user_id;
—— 这只会返回有订单的用户。
LEFT JOIN
(左连接)：
作用：返回左表中的所有行，以及右表中与左表匹配的行。如果右表中没有匹配项，右表对应的列会显示
NULL
。 何时使用：当你需要保留左表的所有记录，并尝试关联右表信息时。这是我最常用的一种连接，因为它能帮助我从一个主体的视角去审视数据。比如，查看所有产品，并显示它们是否有对应的销售记录。例子：
SELECT * FROM users LEFT JOIN orders ON users.user_id = orders.user_id;
—— 这会返回所有用户，包括那些没有订单的用户。
RIGHT JOIN
(右连接)：
作用：返回右表中的所有行，以及左表中与右表匹配的行。如果左表中没有匹配项，左表对应的列会显示
NULL
。 何时使用：与
LEFT JOIN
相反，当你需要保留右表的所有记录，并尝试关联左表信息时。不过，在实际操作中，
RIGHT JOIN
用的相对较少，因为大多数情况下，你可以通过交换
FROM
和
LEFT JOIN
后面的表名，用
LEFT JOIN
来实现同样的效果。例如，
table1 RIGHT JOIN table2
等同于
table2 LEFT JOIN table1
。例子：
SELECT * FROM users RIGHT JOIN orders ON users.user_id = orders.user_id;
—— 这会返回所有订单，以及下这些订单的用户信息。如果某个订单的
user_id
在
users
表中不存在（数据异常），那么
users
表的列会是
NULL
。

总的来说，选择哪种连接取决于你希望以哪个表为主体，以及你对不匹配行处理的需求。

在实际应用中，LEFT JOIN可能遇到的性能问题和优化策略有哪些？

LEFT JOIN

虽然强大，但在处理大量数据时，如果不加注意，也可能成为性能瓶颈。我遇到过不少次因为没有优化好

LEFT JOIN

导致查询慢如蜗牛的情况，那感觉可真不好受。

缺少索引：
问题：这是最常见的问题。如果
ON
子句中用于连接的列没有索引，MySQL 就需要进行全表扫描来查找匹配项，这在表数据量大时会非常慢。优化：确保
ON
子句中涉及的列（尤其是右表的连接列）都创建了索引。对于
u.user_id = o.user_id
，
users.user_id
和
orders.user_id
都应该有索引。通常主键或唯一键会自动创建索引，但外键列有时需要手动添加。

*选择不必要的列（`SELECT `）**：
问题：如果你的查询结果只需要几列，但却使用了
SELECT *
，数据库会读取并传输所有列的数据，这增加了I/O和网络开销。 优化：只选择你真正需要的列。这不仅减少了数据传输量，有时还能让数据库使用覆盖索引（如果索引包含了所有查询的列），避免回表查询。

连接大表与大表：
问题：当两个非常大的表进行
LEFT JOIN
时，即使有索引，操作也可能非常耗时，因为需要处理的数据量依然巨大。优化： 缩小右表范围：如果可能，先对右表进行过滤（使用
WHERE
子句），减少需要连接的数据量。例如，如果你只关心最近一个月的订单，可以先
WHERE o.order_date >= CURDATE() - INTERVAL 1 MONTH
。 分批处理：对于极大的数据集，考虑将查询拆分成小批次处理，然后合并结果。 反向思维：有时候，将
LEFT JOIN
转换成子查询或者
EXISTS
/
NOT EXISTS
可能会有更好的性能，但这需要具体场景具体分析。

WHERE
子句的位置：
问题：
WHERE
子句如果放在
LEFT JOIN
之后，对右表的过滤可能会在连接操作之后才进行，导致先连接了大量数据，再进行过滤。优化：如果你的
WHERE
条件是针对右表的，并且你希望在连接之前就减少右表的行数，那么最好将该条件放在
LEFT JOIN
之前的子查询中，或者考虑将
LEFT JOIN
变为
INNER JOIN
(如果过滤掉右表不匹配的行是你的本意)。 错误示例：
SELECT * FROM users u LEFT JOIN orders o ON u.user_id = o.user_id WHERE o.amount > 100;
(这实际上会将
LEFT JOIN
的效果变为
INNER JOIN
，因为
o.amount > 100
会过滤掉所有
o.amount
为
NULL
的行) 正确优化（如果想保留所有用户但只看特定订单）：
SELECT * FROM users u LEFT JOIN (SELECT * FROM orders WHERE amount > 100) o ON u.user_id = o.user_id;
或者直接将条件放在
ON
子句中：
SELECT * FROM users u LEFT JOIN orders o ON u.user_id = o.user_id AND o.amount > 100;
(后者更常用且效率更高)

使用
EXPLAIN
分析查询计划：
工具：这是我排查 SQL 性能问题时必用的工具。
EXPLAIN SELECT ...
可以展示 MySQL 如何执行你的查询，包括它使用了哪些索引、扫描了多少行、连接顺序等。实践：通过分析
EXPLAIN
的输出，你可以清楚地看到哪个环节出了问题，从而有针对性地进行优化。

总之，优化