详解GaussDB(DWS) explain分布式执行计划的示例

摘要：本文主要介绍如何详细解读GaussDB(DWS)产生的分布式执行计划，从计划中发现性能调优点。前言

执行计划(又称解释计划)是数据库执行SQL语句的具体步骤，例如通过索引还是全表扫描访问表中的数据，连接查询的实现方式和连接的顺序等。如果 SQL 语句性能不够理想，我们首先应该查看它的执行计划。本文主要介绍如何详细解读GaussDB(DWS)产生的分布式执行计划，从计划中发现性能调优点。

1、执行算子介绍

要读懂执行计划，首先要知道数据库执行算子的概念：

下面重点介绍下基于sharing nothing的分布式计划中最重要的一类算子――STREAM算子

三种类型的stream算子

1)Gather Stream(N:1) ?C 每个源结点都将其数据发送给目标结点

2)Redistribute Stream(N:N) ?C 每个源节点将其数据根据连接条件计算Hash值，根据重新计算的Hash值进行分布，发给对应的目标节点

3)Broadcast Stream(1:N) ?C 由一个源节点将其数据发给N个目标节点

其中1）主要用于CN与DN间的数据交换，2）与3）主要用于DN间的数据交换

2、EXPLAIN用法

SQL执行计划是一个节点数，显示执一条SQL语句执行时的详细步骤。每一个步骤是一个数据库运算符，也叫作一个执行算子。使用explain命令可以查看优化器为每个查询生成的具体执行计划。

1) EXPLAIN的语法

其中，option中COSTS与NODES的默认值为ON，其他参数默认为OFF。

说明：

a) EXPLAIN + QUERY并不会真正执行，只会将计划打印出来，指定option中的ANALYZE可以进行实际执行

b) PERFORMANCE 选项默认会将所有的选项置为ON，即显示所有的执行信息。

c) CPU/BUFFER/DETAIL 选项依赖于ANALYZE，只有ANALYZE置为ON的时候，才能使用这几个选项。

d) DETAIL选项用来控制输出，DETAIL 置为ON时，会显示各个DN上具体的执行信息；DATAIL 置为OFF时，显示所有DN的汇总信息，即最大最小值信息。

2) EXPLAIN显示格式

GaussDB中提供了两种显示格式（normal/pretty），通过设置参数explain_perf_mode进行控制。其中，normal格式为默认的显示格式。

normal格式如下：

pretty格式如下：

改进后的显示格式，层次清晰，计划包含了plan node id，性能分析会更加简单直接。

使用之前可以使用show explain_perf_mode;来查看当前数据库使用的显示风格。

同时可以使用set explain_perf_mode=pretty/normal;来设置输出的格式。

3、示例计划解读（每个算子资源消耗、耗时等等）

1）四中常见类型计划

建表语句：

a) FQS计划，完全下推，下发query

两表JOIN，且其连接条件为各表的分布列，在关闭stream算子的情况下，CN会直接将该语句发送至各DN执行，最后结果在CN汇总。

b) 非FQS计划，部分语句下推

两表JOIN，且连接条件中包含非分布列，此时在关闭stream算子的情况下，CN会将基表扫描语句下发至各DN，然后在CN上进行JOIN。

c) Stream计划，DN之间无数据交换

两表JOIN，且连接条件为各表的分布列，因此各DN无需数据交换。CN生成stream计划后，将除Gather Stream的计划下发给DN执行，在各个DN上进行基表扫描，并进行哈希连接后，发送给CN。

d) Stream计划，DN之间存在数据交换

两表JOIN，且连接条件包含非分布列，在开启stream算子的情况下，会生成stream计划，其DN间存在数据交换。此时对于tt02表，会在各DN进行基表扫描，扫描后会通过Redistribute Stream算子，按照JOIN条件中的tt02.c1进行哈希计算后重新发送给各DN，然后在各DN上做JOIN，最后汇总到CN。

2) explain performance详解

a) 执行计划

•id：执行算子节点编号。

•operation：具体的执行节点算子名称。

•A-time:各DN相应算子执行时间，[]中左侧为最小值，右侧为最大值，包括下层算子执行时间。

•A-rows：相应算子输出的全局总行数。

•E-rows：每个算子估算的输出行数。

•Peak Memory：各DN相应算子消耗内存峰值，[]中左侧为最小值，右侧为最大值。

•E-memory：DN上每个算子估算的内存使用量，只有DN上执行的算子会显示。某些场景会在估算的内存使用量后使用括号显示该算子在内存源充足下可以自动扩展的内存上限。

•E-width：每个算子输出元组的估算宽度。

•E-costs：每个算子估算的执行代价。

b) 谓词过滤

显示对应执行算子节点的过滤条件

c) 内存使用

主要显示CN的最大内存用量、DN最大内存用量、各算子的最大内存用量、各算子预估内存用量、Stream线程的启动以及收发时间。

d) Targetlist Information

各个算子对应的输出目标列信息。

e) DN信息

各算子的执行时间、Buffer、CPU信息

f) 自定义信息

CN与DN之间的建连信息、DN与DN之间的建连信息。

g) 汇总信息

DN执行器开始时间，[min_node_name, max_node_name] : [min_time, max_time]DN执行器结束时间，[min_node_name, max_node_name] : [min_time, max_time]Remote query poll time：接收结果时用于poll等待的时间CN执行器开始、运行及结束时间网络流量，stream算子发送的数据量优化器执行期时间查询ID总执行时间

h) 执行时间介绍

每个算子的执行信息都包含三个部分：