在MySQL中优化UNION查询的性能,索引的使用非常关键。UNION操作会合并两个或多个SELECT结果集,并自动去重(UNION ALL不去重),如果每个子查询没有合理利用索引,数据库可能执行全表扫描,导致性能下降。
理解UNION查询的执行机制
MySQL在执行UNION时,会分别运行每个SELECT语句,将结果放入临时表,最后进行去重和排序(仅UNION,UNION ALL不排序)。因此,提升每个子查询的效率是优化的关键。
每个SELECT应尽可能通过索引快速定位数据 避免在大表上无索引扫描后合并 临时表可能使用磁盘存储,影响速度为每个子查询建立合适的索引
确保每个UNION中的SELECT都能使用索引,尤其是WHERE、JOIN、ORDER BY涉及的列。
若查询基于status字段筛选,应在各表的status列上建立索引 复合查询条件应考虑组合索引,如 (status, created_at) 覆盖索引可避免回表,提升速度例如:
-- 查询1 SELECT id, name FROM users WHERE status = 1; -- 查询2 SELECT id, name FROM users_archived WHERE status = 1; <p>-- 优化:在 users(status) 和 users_archived(status) 上建立索引 CREATE INDEX idx_status ON users(status); CREATE INDEX idx_status_archive ON users_archived(status);</p>
优先使用 UNION ALL
如果业务允许重复数据,用UNION ALL代替UNION。它不会去重,也不隐式排序,性能更好。
UNION需要额外的排序和去重步骤,常导致临时表写入磁盘 UNION ALL直接追加结果,减少开销示例:
-- 更高效 SELECT id FROM t1 WHERE condition UNION ALL SELECT id FROM t2 WHERE condition;
限制结果集并尽早过滤
在每个子查询中使用LIMIT和精确的WHERE条件,减少参与UNION的数据量。
提前过滤无效数据,降低索引扫描范围 若最终只需前N条,可在子查询中先LIMIT再合并例如:
(SELECT id FROM logs_2023 WHERE user_id = 100 LIMIT 10) UNION ALL (SELECT id FROM logs_2024 WHERE user_id = 100 LIMIT 10) LIMIT 10;
基本上就这些。关键是让每个子查询走索引,避免全表扫描,同时根据场景选择UNION或UNION ALL,控制数据量。
