Mysql的sql执行计划详解&sql性能优化示例

-- Mysql的sql执行计划详解&sql性能优化示例
【官网】:https://www.mysql.com/

应用场景

为了知道SQL语句的优化方向,我们需要查看SQL语句的具体执行过程,以理解影响SQL语句执行效率的问题所在。 通常会使用explain+SQL语句来模拟优化器执行SQL查询语句,从而知道mysql是如何处理sql语句的:是否采用了索引,是否采用了正确的索引,扫描行数,key长度,查询类型等

基础资源

mysql

使用须知

性能优化包括了调用链的优化(业务设计,前端,应用程序,缓存,数据库设计,sql优化等),我们综合评估各节点优化的投入产出后,才决定是否去优化sql性能。

配置步骤

暂无

常见问题

快速入门


A)如何查看(mysql)sql的执行计划?

MySql提供了EXPLAIN语法用来进行查询分析,在SQL语句前加一个"EXPLAIN"即可。比如我们要分析如下SQL语句:
explain select * from table where table.id = 1
运行上面的sql语句后你会看到,下面的表头信息:
 id、select_type、table、partitions、type、possible_keys、key、key_len、ref、rows、filtered、Extra .


B)sql执行计划的详解.

一、id

id::表示查询中执行select子句或者操作表的顺序,id的值越大,代表优先级越高,越先执行。id大致会出现 3种情况:

注:The SELECT identifier(每个select子句的标识id)

1、id相同

看到三条记录的id都相同,可以理解成这三个表为一组,具有同样的优先级,执行顺序由上而下,具体顺序由优化器决定。

2、id不同

如果我们的SQL中存在子查询,那么id的序号会递增,id值越大优先级越高,越先被执行 。当三个表依次嵌套,发现最里层的子查询id最大,最先执行。

 
2、两种情况都存在

i以上两种同时存在。相同id划分为一组,这样就有三个组,同组的从上往下顺序执行,不同组id值越大,优先级越高,越先执行。


二、select_type

select_type:表示select查询的类型,主要是用于区分各种复杂的查询,例如:普通查询、联合查询、子查询等。

1、SIMPLE

SIMPLE:表示最简单的 select 查询语句,也就是在查询中不包含子查询或者union交并差集等操作。

2、PRIMARY

PRIMARY:当查询语句中包含任何复杂的子部分,最外层查询则被标记为PRIMARY。

3、SUBQUERY

SUBQUERY:当select或where列表中包含了子查询,该子查询被标记为:SUBQUERY。

4、DERIVED

DERIVED:表示包含在from子句中的子查询的select,在我们的from列表中包含的子查询会被标记为derived。

5、UNION

UNION:如果union后边又出现的select语句,则会被标记为union;若union包含在from子句的子查询中,外层select将被标记为derived。

6、UNION RESULT

UNION RESULT:代表从union的临时表中读取数据,而table列的<union1,4>表示用第一个和第四个select的结果进行union操作。


三、table

查询的表名,并不一定是真实存在的表,有别名显示别名,也可能为临时表,例如上边的DERIVED、<union1,4>等。

四、partitions

查询时匹配到的分区信息,对于非分区表值为NULL,当查询的是分区表时,partitions显示分区表命中的分区情况。

:The matching partitions (显示查询将访问的分区,如果你的查询是基于分区表)

五、type

type:查询使用了何种类型,它在SQL优化中是一个非常重要的指标,以下性能从好到坏依次是:

system>const>eq_ref>ref>ref_or_null>index_merge>unique_subquery>index_subquery>range>index>ALL

注:The join type(当前表内访问方式)

1、system

system: 当表仅有一行记录时(系统表),数据量很少,往往不需要进行磁盘IO,速度非常快。

2、const

const:表示查询时命中primary key主键或者unique唯一索引,或者被连接的部分是一个常量(const)值。这类扫描效率极高,返回数据量少,速度非常快。

3、eq_ref

eq_ref:查询时命中主键primary key或者unique key索引,type就是eq_ref。

4、ref

ref:区别于eq_ref,ref表示使用非唯一性索引,会找到很多个符合条件的行。

 
5、ref_or_null

ref_or_null:这种连接类型类似于 ref,区别在于MySQL会额外搜索包含NULL值的行。

6、index_merge

index_merge:使用了索引合并优化方法,查询使用了两个以上的索引。

7、unique_subquery

unique_subquery:替换下面的IN子查询,子查询返回不重复的集合。

value IN (SELECT primary_key FROM single_table WHERE some_expr) 复制代码
8、index_subquery

index_subquery:区别于unique_subquery,用于非唯一索引,可以返回重复值。

value IN (SELECT key_column FROM single_table WHERE some_expr) 复制代码
9、range

range:使用索引选择行,仅检索给定范围内的行。简单点说就是针对一个有索引的字段,给定范围检索数据。在where语句中使用bettween...and、<、>、<=、in等条件查询type都是range。

举个栗子:three表中three_id为唯一主键,user_id普通字段未建索引。

从结果中看到只有对设置了索引的字段,做范围检索type才是range。
10、index

index:Index与ALL其实都是读全表,区别在于index是遍历索引树读取,而ALL是从硬盘中读取。

下边示例:three_id为主键,不带where条件全表查询 ,type结果为index。

11、ALL

ALL:将遍历全表以找到匹配的行,性能最差。

六、possible_keys

possible_keys:表示在MySQL中通过哪些索引,能让我们在表中找到想要的记录,一旦查询涉及到的某个字段上存在索引,则索引将被列出,但这个索引并不定一会是最终查询数据时所被用到的索引。具体请参考上边的例子。

:The possible indexes to choose(可能使用到的索引)


七、key

key:区别于possible_keys,key是查询中实际使用到的索引,若没有使用索引,显示为NULL。具体请参考上边的例子。

当type为index_merge时,可能会显示多个索引。

:The index actually chosen(经过优化器评估最终使用的索引)

八、key_len

key_len:表示查询用到的索引长度(字节数),原则上长度越短越好 。

  • 单列索引,那么需要将整个索引长度算进去;
  • 多列索引,不是所有列都能用到,需要计算查询中实际用到的列。

注意:key_len只计算where条件中用到的索引长度,而排序和分组即便是用到了索引,也不会计算到key_len中。

注1:The length of the chosen key (使用到的索引长度)

注2: 表示索引中使用的字节数,可以通过key_len计算查询中使用的索引长度,在不损失精度的情况下长度越短越好。
 1、一般地,key_len 等于索引列类型字节长度,例如int类型为4 bytes,bigint为8 bytes; 
2、如果是字符串类型,还需要同时考虑字符集因素,例如utf8字符集1个字符占3个字节,gbk字符集1个字符占2个字节 
3、若该列类型定义时允许NULL,其key_len还需要再加 1 bytes 
4、若该列类型为变长类型,例如 VARCHAR(TEXT\BLOB不允许整列创建索引,如果创建部分索引也被视为动态列类型),其key_len还需要再加 2 bytes 字符集会影响索引长度、数据的存储空间,为列选择合适的字符集;变长字段需要额外的2个字节,固定长度字段不需要额外的字节。而null都需要1个字节的额外空间,所以以前有个说法:索引字段最好不要为NULL,因为NULL让统计更加复杂,并且需要额外一个字节的存储空间。

九、ref

ref:常见的有:const,func,null,字段名。

  • 当使用常量等值查询,显示const,
  • 当关联查询时,会显示相应关联表的关联字段
  • 如果查询条件使用了表达式、函数,或者条件列发生内部隐式转换,可能显示为func
  • 其他情况null

:The columns compared to the index(引用到的上一个表的列)

十、rows

rows:以表的统计信息和索引使用情况,估算要找到我们所需的记录,需要读取的行数。

Estimate of rows to be examined (要得到最终记录索要扫描经过的记录数)

这是评估SQL性能的一个比较重要的数据,mysql需要扫描的行数,很直观的显示SQL性能的好坏,一般情况下rows值越小越好。

[注]根据表的统计信息及索引使用情况,大致估算出找出所需记录需要读取的行数,此参数很重要,直接反应的sql找了多少数据,在完成目的的情况下越少越好


十一、filtered

:Percentage of rows filtered by table condition(存储引擎返回的数据在server层过滤后,剩下满足查询的记录数量的比例)

filtered这个是一个百分比的值,表里符合条件的记录数的百分比。简单点说,这个字段表示存储引擎返回的数据在经过过滤后,剩下满足条件的记录数量的比例。

在MySQL.5.7版本以前想要显示filtered需要使用explain extended命令。MySQL.5.7后,默认explain直接显示partitions和filtered的信息。

十二、Extra

Extra:不适合在其他列中显示的信息,Explain中的很多额外的信息会在Extra字段显示。

1、Using index

Using index:我们在相应的select操作中使用了覆盖索引,通俗一点讲就是查询的列被索引覆盖,使用到覆盖索引查询速度会非常快,SQl优化中理想的状态。

什么又是覆盖索引?

一条SQL只需要通过索引就可以返回,我们所需要查询的数据(一个或几个字段),而不必通过二级索引,查到主键之后再通过主键查询整行数据(select *)。

one_id表为主键

注意:想要使用到覆盖索引,我们在select时只取出需要的字段,不可select *,而且该字段建了索引。

2、Using where

Using where:查询时未找到可用的索引,进而通过where条件过滤获取所需数据,但要注意的是并不是所有带where语句的查询都会显示Using where。


3、Using temporary

Using temporary:表示查询后结果需要使用临时表来存储,一般在排序或者分组查询时用到。

4、Using filesort

Using filesort:表示无法利用索引完成的排序操作,也就是ORDER BY的字段没有索引,通常这样的SQL都是需要优化的。

如果ORDER BY字段有索引就会用到覆盖索引,相比执行速度快很多。

5、Using join buffer

Using join buffer:在我们联表查询的时候,如果表的连接条件没有用到索引,需要有一个连接缓冲区来存储中间结果。


6、Impossible where

Impossible where:表示在我们用不太正确的where语句,导致没有符合条件的行。

7、No tables used

No tables used:我们的查询语句中没有FROM子句,或者有FROM DUAL子句。



参考资料