1 、 Explain 介绍
Explain 是一个非常有的命令,可以用来获取关于查询执行计划的信息,以及如何解释输出。
2 、调用 Explain
要使用 Explain ,只需在查询中的 select 关键字之前增加 Explain 这个词。 MySQL 会在查询上设置一个标记。当执行查询时,这个标记会使其返回关于在执行计划中每一步的信息,而不真实执行。
explain select * from goods;

3 、 Expalin 变种
Explain extended 看起来和正常的 explain 行为一样,但它会告诉服务器“逆向编译”执行计划为一个 select 语句。可以通过紧接其后运行 show warnings 看到这个生成的语句。
Extended 在 8.0 版本已弃用该方式


这个语句直接来自执行计划,而不是原 SQL 语句,到这点上已经变成一个数据结构。大部分场景下,它都是优化过的,跟原语句不相同,可以学习查询优化器到底是如何转化语句的。
Explain partitions 会显示查询将访问的分区,如果查询是基于分区表的话。一般认为增加 explain 时, MySQL 语句不会执行查询,这是错误的。如果查询在 from 子句中包括子查询,那么 MySQL 实际上是会执行子查询,将其结果放在一个临时表中,然后完成外层查询优化。
4 、 Expalin 限制
l Explain 根本不会告诉你触发器,存储过程或者 UFD 会如何影响查询。
l 它不支持存储过程,尽管可以手动抽取查询并单独地对其进行 explain 操作。
l 它并不会告诉你 MySQL 在查询执行中所做的特定优化。
l 它并不会显示关于查询的执行计划的所有信息。
l 它并不区分具有相同名字的事物。
l 比如,对内存排序和临时文件都用 “ filesort ”,对磁盘上和内存中的临时表都显示“ Using temporary ”。
l 可能会误导。比如,会对一个有着很小的 LIMIT 的查询显示全索引扫描。
5 、重写非 SELECT 查询
MySQL Explain 只能解释 select 查询,并不会对存储过程调用和 insert , update , delete 或其他语句做解释。但是,我们可以重写这些非 select 语句来利用 explain 。为了利用 explain ,我们需要将这些语句转化成一个等价的访问所有相同列的 select ,所有需要的列必须在 select 列表,关联子句,或者 where 子句中。
6 、 Explain 中的列
explain
select e.user_name,d.dept_no,d.dept_address
from
employee_info e
left join
employee_sal s
on e.emp_no = s.emp_no
left join
dept d
on s.dept_no = d.dept_no;
( 1)、id 列
这一列总是包含一个编号,标示 select 所属的行。数字越大越先执行,如果说数字一样大,那么就从上往下依次执行, id 列为 null 的就表示这是一个结果集,不需要使用它来进行查询。
( 2)、select_type 列
这一列显示了对应行是简单还是复杂 select 。
常见的有:
simple :表示不包含 union 操作或者不包含子查询的简单 select 查询。有连接查询时,外层的查询为 simple ,且只有一个
primary :一个需要 union 操作或者含有子查询的 select ,位于最外层的单位查询的 select_type 即为 primary 。且只有一个
union : union 连接的两个 select 查询,第一个查询是 dervied 派生表,除了第一个表外,第二个以后的表 select_type 都是 union
dependent union :与 union 一样,出现在 union 或 union all 语句中,但是这个查询要受到外部查询的影响
union result :包含 union 的结果集,在 union 和 union all 语句中 , 因为它不需要参与查询,所以 id 字段为 null
subquery :除了 from 字句中包含的子查询外,其他地方出现的子查询都可能是 subquery
dependent subquery :与 dependentunion 类似,表示这个 subquery 的查询要受到外部表查询的影响
derived : from 字句中出现的子查询,也叫做派生表,其他数据库中可能叫做内联视图或嵌套 select
( 3)、table 列
这一列显示了对应行正在访问查询的表名,如果查询使用了别名,那么这里显示的是别名,如果不涉及对数据表的操作,那么这显示为 null ,如果显示为尖括号括起来的 <derived N> 就表示这个是临时表,后边的 N 就是执行计划中的 id ,表示结果来自于这个查询产生。如果是尖括号括起来的 <union M,N> ,与 <derived N> 类似,也是一个临时表,表示这个结果来自于 union 查询的 id 为 M,N 的结果集。
( 4)、type 列
这一列显示了访问类型,即 MySQL 决定如何查找表中的行。
依次从好到差: system , const , eq_ref , ref , fulltext , ref_or_null , unique_subquery , index_subquery , range , index_merge , index , ALL ,除了 all 之外,其他的 type 都可以使用到索引,除了 index_merge 之外,其他的 type 只可以用到一个索引
system :
表中只有一行数据或者是空表,且只能用于 myisam 和 memory 表。如果是 Innodb 引擎表, type 列在这个情况通常都是 all 或者 index
const :
使用唯一索引或者主键,返回记录一定是 1 行记录的等值 where 条件时,通常 type 是 const 。其他数据库也叫做唯一索引扫描
eq_ref :
出现在要连接过个表的查询计划中,驱动表只返回一行数据,且这行数据是第二个表的主键或者唯一索引,且必须为 not null ,唯一索引和主键是多列时,只有所有的列都用作比较时才会出现 eq_ref
ref :
不像 eq_ref 那样要求连接顺序,也没有主键和唯一索引的要求,只要使用相等条件检索时就可能出现,常见与辅助索引的等值查找。或者多列主键、唯一索引中,使用第一个列之外的列作为等值查找也会出现,总之,返回数据不唯一的等值查找就可能出现。
fulltext :
全文索引检索,要注意,全文索引的优先级很高,若全文索引和普通索引同时存在时, mysql 不管代价,优先选择使用全文索引
ref_or_null :
与 ref 方法类似,只是增加了 null 值的比较。实际用的不多。
unique_subquery :
用于 where 中的 in 形式子查询,子查询返回不重复值唯一值
index_subquery :
用于 in 形式子查询使用到了辅助索引或者 in 常数列表,子查询可能返回重复值,可以使用索引将子查询去重。
range :
索引范围扫描,常见于使用 >,<,isnull,between ,in ,like 等运算符的查询中。
index_merge :
表示查询使用了两个以上的索引,最后取交集或者并集,常见 and , or 的条件使用了不同的索引,官方排序这个在 ref_or_null 之后,但是实际上由于要读取所个索引,性能可能大部分时间都不如 range
index :
索引全表扫描,把索引从头到尾扫一遍,常见于使用索引列就可以处理不需要读取数据文件的查询、可以使用索引排序或者分组的查询。
all :
这个就是全表扫描数据文件,然后再在 server 层进行过滤返回符合要求的记录。
( 5)、possible_keys 列
查询可能使用到的索引都会在这里列出来。这个列表是优化过程早期创建的,因此有些罗列出来的索引有可能后续是没用的。
( 6)、key 列
显示了查询真正使用到的索引, select_type 为 index_merge 时,这里可能出现两个以上的索引,其他的 select_type 这里只会出现一个。
如果该索引没有出现在 possible_keys 列中,那么 MySQL 选用它是出于另外的原因,比如选择了一个覆盖索引。
possible_keys 揭示了哪一个索引能有助于高效地行查找, key 显示了优化采用哪一个索引可以最小化查询成本。
( 7)、key_len 列
用于处理查询的索引长度,如果是单列索引,那就整个索引长度算进去,如果是多列索引,那么查询不一定都能使用到所有的列,具体使用到了多少个列的索引,这里就会计算进去,没有使用到的列,这里不会计算进去。
留意下这个列的值,算一下你的多列索引总长度就知道有没有使用到所有的列了。要注意, mysql 的 ICP 特性使用到的索引不会计入其中。另外, key_len 只计算 where 条件用到的索引长度,而排序和分组就算用到了索引,也不会计算到 key_len 中。
( 8)、ref 列
如果是使用的常数等值查询,这里会显示 const ,如果是连接查询,被驱动表的执行计划这里会显示驱动表的关联字段,如果是条件使用了表达式或者函数,或者条件列发生了内部隐式转换,这里可能显示为 func
( 9)、row 列
这里是执行计划中估算的扫描行数,不是精确值。
( 10)、filterd 列
使用 explain extended 时会出现这个列, 5.7 之后的版本默认就有这个字段,不需要使用 explain extended 了。这个字段表示存储引擎返回的数据在 server 层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数。
( 11)、extra 列
这个列可以显示的信息非常多,有几十种,常用的有
distinct :
在 select 部分使用了 distinc 关键字
no tables used :
不带 from 字句的查询或者 Fromdual 查询
使用 not in() 形式子查询或 notexists 运算符的连接查询,这种叫做反连接。即,一般连接查询是先查询内表,再查询外表,反连接就是先查询外表,再查询内表。
using filesort :
排序时无法使用到索引时,就会出现这个。常见于 order by 和 group by 语句中
using index :
查询时不需要回表查询,直接通过索引就可以获取查询的数据。
using sort_union , using_union , usingintersect , using sort_intersection :
using intersect :表示使用 and 的各个索引的条件时,该信息表示是从处理结果获取交集。
using union :表示使用 or 连接各个使用索引的条件时,该信息表示从处理结果获取并集。
using sort_union 和 usingsort_intersection :与前面两个对应的类似,只是他们是出现在用 and 和 or 查询信息量大时,先查询主键,然后进行排序合并后,才能读取记录并返回。
using temporary :
表示使用了临时表存储中间结果。临时表可以是内存临时表和磁盘临时表,执行计划中看不出来,需要查看 status 变量, used_tmp_table , used_tmp_disk_table 才能看出来。
using where :
表示存储引擎返回的记录并不是所有的都满足查询条件,需要在 server 层进行过滤。
7 、纵向表结构
在查询过程中,有时候信息太多的时候,横向输出会特别不容易读取,这时候,我们可以使用 G 将结果进行格式转换,将横向的表结构会转为使用纵向表结构输出,利于阅读。
这个格式化输出也可以用在 select 语句后,如下:
explain
select e.user_name,d.dept_no,d.dept_address
from
employee_info e
left join
employee_sal s
on e.emp_no = s.emp_no
left join
dept d
on s.dept_no = d.dept_no\G
