一、介绍
explain简称SQL执行计划,它可以帮助我们模拟优化器执行SQL查询语句,从而知道mysql是如何处理我们的sql语句;分析查询语句或是表结构的性能瓶颈。
它可以帮助我们做以下事情:
- 表的读取顺序 [id]
- 数据读取操作的操作类型 [type]
- 哪些索引可能被使用[pssible_keys]
- 哪些索引被实际使用 [key]
- 表之间的引用 [ref]
- 每张表优多少行被优化器查询 [rows]
二、使用
首先查看一下表的索引建立情况,索引建立完成之后再使用explain分析
show index from tablename;
我们在mysql客户端执行explain sql语句
:
explain select * from article;
执行结果如下:
我们逐步分析一下各个字段的含义:
id
:代表select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
- id相同时,执行顺序由上至下
- id不同时,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
- id 既有相同又有不同时,id值越大的越先执行,id一样的顺序执行
select_type
:代表查询的类型,主要用于区别普通查询、联合查询、子查询等复杂查询。
常见的类型如下
类型值 | 含义 |
---|---|
SIMPLE | 简单的查询(查询中不包含子查询或UNION) |
PRIMARY | 查询中若包含任何复杂的子查询,最外层查询则被标记为PRIMARY |
SUBQUERY | 在select或where列表中包含的子查询 |
DERIVED | 在from列表中包含的子查询被标记为DERIVED(衍生),mysql会递归执行这些子查询,把结果放在临时表里 |
UNION | 若第二个select出现在union之后,则被标记为union;若union包含在from子句的子查询中,外层select被标记为DERIVED |
UNION RESULT | 从UNION表获取结果的select |
所有参数详见官方文档
table
:对应的表名
type
:代表查询中使用的类型,从最优到最差依次为:
- system:官方的解释为当表只有一行数据,这是一个特别const,通常是不会出现的。
- const:表示通过索引一次就找到了,const用于主键索引或唯一索引,因为只匹配一行数据。比如将主键置于where条件中:
where primary_key =1
,mysql将该查询转换为常量。 - eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常用于主键或唯一索引扫描;它发生在
=
运算符比较的索引列,我们看示例:
SELECT * FROM ref_table,other_table
WHERE ref_table.key_column=other_table.column;
---或者
SELECT * FROM ref_table,other_table
WHERE ref_table.key_column_part1=other_table.column
AND ref_table.key_column_part2=1;
---我们都使用了 = 索引比较
- ref:非唯一性索引扫描,返回匹配某个单独值的所有行。本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而它可能会找到多个符合条件的行,所以它属于查找和扫描的混合体
- ref_or_null:它跟ref类似,但是它进行了额外的空值(NULL)匹配,示例:
SELECT * FROM ref_table
WHERE key_column=expr OR key_column IS NULL;
- index_merge:使用
or
合并多个索引扫描的结果。只使用于单个表扫描;示例:
SELECT * FROM tbl_name WHERE key1 = 10 OR key2 = 20;
SELECT * FROM tbl_name
WHERE (key1 = 10 OR key2 = 20) AND non_key = 30;
SELECT * FROM t1, t2
WHERE (t1.key1 IN (1,2) OR t1.key2 LIKE 'value%')
AND t2.key1 = t1.some_col;
- range:使用索引检索给定的范围内的数据,比如我们在where中使用 =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, LIKE, or IN()。它将范围扫描索引,不用扫描全部索引。
SELECT * FROM tbl_name
WHERE key_column BETWEEN 10 and 20;
SELECT * FROM tbl_name
WHERE key_column IN (10,20,30);
SELECT * FROM tbl_name
WHERE key_part1 = 10 AND key_part2 IN (10,20,30);
- index:只查询某个索引列时触发,它将遍历索引树,从索引中读取数据。如:
select id from category
- all:全表扫描,并且查询列未建立索引。如:
select id,catname from category
,catname
未建立索引
possible_keys
:显示可能应用在这张表中的索引,一个或多个;查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
key
:实际使用的索引。如果为NULL,则没有使用索引;查询中若使用了覆盖索引,则该索引仅出现在key列中
覆盖索引说明:查询的数据列只要从索引中就能够获取,不必读取数据行,mysql可以利用索引返回查询列中字段,而不必根据索引再次读取数据表文件。
key_len
:表示索引中使用的子节数,可通过该列计算查询中使用的索引长度。在不损失精准性的情况下,长度越短越好。显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的
ref
:显示索引的哪一列被使用了,有可能是一个常量。用于表示哪些列或常量被用于查找索引列上的值。
我们来看一个示例:
article
表的主键为id
,我们使用category
表的article_id
来查询article
表中id=article_id
的对应数据,也就是说article_id
被用于查找article
表索引列上的值,所以article
的ref
值为category.article_id
; 我们看到article
表的type
类型为eq_ref
,因为我们使用到了主键索引扫描。
rows
:根据表统计信息及索引选用情况,大致估算出找到所需记录需要读取的行数
Extra
:包含不适合在其他列中显示,但十分重要的额外信息,具体如下:
values | description |
---|---|
Using filesort | 说明mysql中会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。mysql中无法利用索引完成的排序操作称为文件排序 ,比如用一个非索引字段排序 |
Using temporary | 使用了临时表保存中间结果,mysql在对查询结果排序时使用了临时表。常见于排序order by和分组查询group by |
Using index | 表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据,效率比较好。如果同时出现了Using where,表明索引被用来执行索引键值的查找;如果没有出现Using where ,表明索引用来读取数据而非执行查找动作,即没有使用where条件。 |
Using where | 表示使用了where条件 |
Using join buffer | 使用了子连接缓存 |
impossible where | where子句的值总是false ,不能用来获取任何元素,比如 where name =’a’ and name = ‘b’ |
Select tables optimized away | 在没有group by 子句的情况下,基于索引优化MIN/MAX 操作或者对于MyISAM 存储引擎优化count(*) 操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。 |
distinct | 优化distinct操作,在找到第一匹配的元素后即停止找同样值的动作 |
三、总结:
我们通常会开启mysql中慢日志,设置时间阀值,将超过设置时间的sql抓取出来,然后通过explain进行分析。
四、参考
EXPLAIN Output Format ,by mysql