详解GaussDB(DWS) explain分布式执行计划的示例-巨人网络通讯

主页 > 知识库 > 详解GaussDB(DWS) explain分布式执行计划的示例

详解GaussDB(DWS) explain分布式执行计划的示例

执行计划(又称解释计划)是数据库执行SQL语句的具体步骤，例如通过索引还是全表扫描访问表中的数据，连接查询的实现方式和连接的顺序等。如果 SQL 语句性能不够理想，我们首先应该查看它的执行计划。本文主要介绍如何详细解读GaussDB(DWS)产生的分布式执行计划，从计划中发现性能调优点。

1、执行算子介绍

要读懂执行计划，首先要知道数据库执行算子的概念：

下面重点介绍下基于sharing nothing的分布式计划中最重要的一类算子——STREAM算子

三种类型的stream算子

1)Gather Stream(N:1) – 每个源结点都将其数据发送给目标结点

2)Redistribute Stream(N:N) – 每个源节点将其数据根据连接条件计算Hash值，根据重新计算的Hash值进行分布，发给对应的目标节点

3)Broadcast Stream(1:N) – 由一个源节点将其数据发给N个目标节点

其中1）主要用于CN与DN间的数据交换，2）与3）主要用于DN间的数据交换

2、EXPLAIN用法

SQL执行计划是一个节点数，显示执一条SQL语句执行时的详细步骤。每一个步骤是一个数据库运算符，也叫作一个执行算子。使用explain命令可以查看优化器为每个查询生成的具体执行计划。

1) EXPLAIN的语法

其中，option中COSTS与NODES的默认值为ON，其他参数默认为OFF。

说明：

a) EXPLAIN + QUERY并不会真正执行，只会将计划打印出来，指定option中的ANALYZE可以进行实际执行

b) PERFORMANCE 选项默认会将所有的选项置为ON，即显示所有的执行信息。

c) CPU/BUFFER/DETAIL 选项依赖于ANALYZE，只有ANALYZE置为ON的时候，才能使用这几个选项。

d) DETAIL选项用来控制输出，DETAIL 置为ON时，会显示各个DN上具体的执行信息；DATAIL 置为OFF时，显示所有DN的汇总信息，即最大最小值信息。

2) EXPLAIN显示格式

GaussDB中提供了两种显示格式（normal/pretty），通过设置参数explain_perf_mode进行控制。其中，normal格式为默认的显示格式。

normal格式如下：

pretty格式如下：

改进后的显示格式，层次清晰，计划包含了plan node id，性能分析会更加简单直接。

使用之前可以使用show explain_perf_mode;来查看当前数据库使用的显示风格。

同时可以使用set explain_perf_mode=pretty/normal;来设置输出的格式。

3、示例计划解读（每个算子资源消耗、耗时等等）

1）四中常见类型计划

建表语句：

a) FQS计划，完全下推，下发query

两表JOIN，且其连接条件为各表的分布列，在关闭stream算子的情况下，CN会直接将该语句发送至各DN执行，最后结果在CN汇总。

b) 非FQS计划，部分语句下推

两表JOIN，且连接条件中包含非分布列，此时在关闭stream算子的情况下，CN会将基表扫描语句下发至各DN，然后在CN上进行JOIN。

c) Stream计划，DN之间无数据交换

两表JOIN，且连接条件为各表的分布列，因此各DN无需数据交换。CN生成stream计划后，将除Gather Stream的计划下发给DN执行，在各个DN上进行基表扫描，并进行哈希连接后，发送给CN。

d) Stream计划，DN之间存在数据交换

两表JOIN，且连接条件包含非分布列，在开启stream算子的情况下，会生成stream计划，其DN间存在数据交换。此时对于tt02表，会在各DN进行基表扫描，扫描后会通过Redistribute Stream算子，按照JOIN条件中的tt02.c1进行哈希计算后重新发送给各DN，然后在各DN上做JOIN，最后汇总到CN。

2) explain performance详解

a) 执行计划

•id：执行算子节点编号。

•operation：具体的执行节点算子名称。

•A-time:各DN相应算子执行时间，[]中左侧为最小值，右侧为最大值，包括下层算子执行时间。

•A-rows：相应算子输出的全局总行数。

•E-rows：每个算子估算的输出行数。

•Peak Memory：各DN相应算子消耗内存峰值，[]中左侧为最小值，右侧为最大值。

•E-memory：DN上每个算子估算的内存使用量，只有DN上执行的算子会显示。某些场景会在估算的内存使用量后使用括号显示该算子在内存源充足下可以自动扩展的内存上限。

•E-width：每个算子输出元组的估算宽度。

•E-costs：每个算子估算的执行代价。

b) 谓词过滤

显示对应执行算子节点的过滤条件

c) 内存使用

主要显示CN的最大内存用量、DN最大内存用量、各算子的最大内存用量、各算子预估内存用量、Stream线程的启动以及收发时间。

d) Targetlist Information

各个算子对应的输出目标列信息。

e) DN信息

各算子的执行时间、Buffer、CPU信息

f) 自定义信息

CN与DN之间的建连信息、DN与DN之间的建连信息。

g) 汇总信息

DN执行器开始时间，[min_node_name, max_node_name] : [min_time, max_time]DN执行器结束时间，[min_node_name, max_node_name] : [min_time, max_time]Remote query poll time：接收结果时用于poll等待的时间CN执行器开始、运行及结束时间网络流量，stream算子发送的数据量优化器执行期时间查询ID总执行时间

h) 执行时间介绍

每个算子的执行信息都包含三个部分：

其中：

dn_6001_6002/dn_6003_6004 表示具体执行的节点信息，括号中的信息是实际的执行信息actualtime=0.013..2290.971 表示实际的执行时间

第一个数字表示执行时进入当前算子到输出第一条数据所花费的时间

第二个数字为输出所有数据的总执行时间

注意：在整个计划中，除了叶子节点的执行时间是算子本身的执行时间，其余算子的执行时间均包含子节点的执行时间。

在该计划中，7号节点和9号节点为叶子节点，其余节点均为非叶子简介。1号节点时顶层节点，所以该节点的执行时间就可以作为整个查询的执行时间。

rows=2001550 表示当前算子输出数据为2001550行；loops=1 表示当前算子的只执行了一次，而对于分区表的扫描（7号节点）来说：

该层扫描算子的loops为7，对于分区表，每一个分区表的扫描就是一次完整的扫描操作，当切换到下一个分区的时候，又是一次新的查询操作，查询该表定义如下：

Inventory表有7个分区，所以就执行了7次表扫描操作，因此loops=7。

i) CPU信息介绍

每个算子执行的过程都有CPU信息，其中cyc代表的是CPU的周期数，ex cyc表示的是当前算子的周期数，不包含其子节点；inc cyc是包含子节点的周期数；ex row是当前算子输出的数据行数；ex c/r则是ex cyc/ex row得到的每条数据所用的平均周期数。

j) Buffer信息介绍

buffers显示缓冲区信息，包括共享块和临时块的读和写。

共享块包含表和索引，临时块在排序和物化中使用的磁盘块。上层节点显示出来的块数据包含了其所有子节点使用的块数。

Buffers涉及的参数有两种，分别为：shared和temp，及shared hit/read/dirtied/written以及temp read/write

Hit blocks：代表从磁盘里面读到的数据块数

Dirtied blocks：代表当前查询中被修改了的并且此前未被修改的数据块数

Written blocks：代表当前线程将shared bufer里被修改的数据写回到磁盘的块数

k) 执行内存

其中：

Peak Memory：5KB 表示当前算子实际执行时使用的峰值内存；

Estimate Memory：1024MB 表示预估的内存，为优化器给出的预估值。

l) 其他执行信息

（1）sort 算子，会显示排序信息

Sort Method代表排序的方法，包括quicksort（快排）和disksort（外排）。快排即内存够用时，所有的排序操作均在内存中完成，外排说明当前可用内存不足，需要下盘。

（2）hashjoin算子

Buckets：代表hash表中实际使用的桶的个数

Batches：代表hashjoin中实际分块的数量。如果Batches=1，则说明所有的数据全在内存中，没有下盘操作；反之则说明有下盘操作，Batches - 1代表临时文件的个数。

Memory Usage：就是hashjoin中内存的使用情况

（3）hashagg算子

如果发生数据下盘，会有File Num：512信息，显示临时文件的个数。

（4）stream算子

stream算子的会统计当前算子处理数据的字节数，其从子线程获取数据的时间（poll time）以及处理数据的时间（Deserialize Time）。

stream算子的子节点会统计发送端的时间信息，如下：

发送时间Send time，排队时间Wait Quota time， OS发送时间以及数据处理的时间。

3) explain 调优示例

一个查询语句要经过多个算子步骤才会输出最终的结果。由于个别算子耗时过长导致整体查询性能下降的情况比较常见。这些算子是整个查询的瓶颈算子。通用的优化手段是EXPLAIN ANALYZE/PERFORMANCE命令查看执行过程的瓶颈算子，然后进行针对性优化。

基表扫描时，对于点查或者范围扫描等过滤大量数据的查询，如果使用SeqScan全表扫描会比较耗时，可以在条件列上建立索引选择IndexScan进行索引扫描提升扫描效率。如下示例：

上述例子中，全表扫描返回3360条数据，过滤掉大量数据，在sssolddate_sk列上建立索引后，使用IndexScan扫描效率显著提高，从960毫秒提升到8毫秒。

结语：

在调优过程中，熟练使用explain并能分析各部分数据结果是非常重要的。本文中仅仅介绍了大多数字段的含义以及根据explain结果进行调优的一个小示例，还可以与plan hint结合使用找出执行的最佳路径，也可以定位倾斜程度等等。

到此这篇关于详解GaussDB(DWS) explain分布式执行计划的文章就介绍到这了,更多相关GaussDB(DWS)分布式执行计划内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

gaussdb 200安装 data studio jdbc idea链接保姆级安装步骤
详解GaussDB for MySQL性能优化
gaussDB数据库常用操作命令详解

标签：台州济源汕头武威广东泰安安徽济宁

巨人网络通讯声明：本文标题《详解GaussDB(DWS) explain分布式执行计划的示例》，本文关键词详解,GaussDB,DWS,explain,分布式,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《详解GaussDB(DWS) explain分布式执行计划的示例》相关的同类信息！

详解GaussDB(DWS) explain分布式执行计划的示例

目录 1、执行算子介绍 2、EXPLAIN用法 3、示例计划解读（每个算子资源消耗、耗时等等）摘要：本文主要介绍如何详细解读GaussDB(DWS)产生的分布式执行计划，从计划中发现性能调优点。...

10-18

店铺地图怎么显示门店？店铺地图怎么显示门店标？

怎么实现地图定位显示附近的商家门店？百度地图菜单里边有位置共享，点击位置共享，按提示操作，并给你要标注的朋友...

11-27

郑州电销外呼机器人（郑州机器人）

本篇文章给大家谈谈郑州电销外呼机器人，以及郑州机器人对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。本...

04-18

昆山信用卡电销员怎么样（昆山办信用卡业务员）

今日给各位共享昆山信誉卡电销员怎么样的常识，其间也会对昆山办信誉卡事务员进行解说，假如能可巧处理你现在面对的问...

06-17

地图标注都需要什么？地图信息标注都需要什么？

做地图标注都需要什么工具？地图标注需要地图测绘尺，圆规，指北针这些材料是不是任何一个地图都需要标注指向标？...

11-26

百度定位要给钱吗？商家百度定位要给钱吗？

百度地图怎么标注要给钱吗？登录“百度本地商户中心”，提交相应的信息及相关资料既可标注，一般8-10个工作日可完成审...

11-26

如何安装400电话家装业开通400电话有效提高服务品质

如何提供优质的服务，如何提高广告的转化率，很多企业可能已经看到了400电话，也有一些公司已经处理了400电话，安装了...

01-12

西安电话外呼系统稳定吗（西安外呼公司）

本篇文章给大家谈谈西安电话外呼系统稳定吗，以及西安外呼公司对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

11-05

win10安装后提示sgtool.exe错误的解决方法

电脑安装升级win10系统出现sgtool.exe系统错误的提示，没有被指定在Windows上运行，或者它包含错误。请尝试使用原始安装媒体...

10-19

亲情电话机器人（电话接听机器人）

本文目录一览： 1、迅为亲情可视电话怎么绑定2、智能电呼机器人有什么作用3、打电话语音机器人怎么弄4、什么是电话客服...

11-27

400电话号码办理全面解析

随着现代社会的发展，越来越多的企业、机构和政府部门开始接入400电话，方便客户咨询、投诉和服务。但是，许多人并不清...

07-21

贵州电话电销机器人哪家强（电销机器人排行）

本篇文章给咱们谈谈贵州电话电销机器人哪家强，以及电销机器人排行对应的常识点，期望对各位有所协助，不要忘了保藏本...

11-07

怎么在腾讯地图添加公司名称？腾讯地图怎么添加公司名称？

怎样在百度地图上添加公司名称？现能做付费标注都通代理商做百度免费午餐终结啦呵呵怎样在百度地图上添加公司名称？...

11-26

CI框架网页缓存简单用法分析

本文实例讲述了CI框架网页缓存简单用法。分享给大家供大家参考，具体如下： CodeIgniter 可以让你通过缓存页面来达到更好的...

10-18

工作手机选择什么？销售都在用这款工作手机！

现在市面上推出的工作手机类型也不少，毕竟移动办公已经成为了非常常见的工作模式。越来越多企业的员工正在通过私人手...

12-07

400电话办理平台选择不能盲目

网络的出现对大部分人来说都是有着非常大好处的,我们不仅可以接收到更多的信息和知识,而且很多事情在网络中处理都会方...

05-09

ai电销机器人培训（ai电销机器人加盟条件）

今天给各位分享ai电销机器人培训的知识，其中也会对ai电销机器人加盟条件进行解释，如果能碰巧解决你现在面临的问题，...

05-16

MySQL的索引详解

目录一. 索引基础 1.1 简介 1.2 索引的工作原理 1.3 索引的类型 1.4 索引的方法 1.5 索引的优点二. 高性能的索引策略 2.1 独立的...

10-18

联通400电话平台（中国联通400电话官网）

【联通400电话平台】随着消费者对于 400电话的认可，越来越多的企业开始办理400电话，目前使用最多的是联通400电话，企业...

11-07

合作作品的著作权

(一)合作作品的概念两人以上共同创作的作品是合作作品。合作作者可以是两个以上的自然人、法人、其他组织或自然人与法...

10-23

怎么提升win7系统桌面刷新速度？提升win7系统桌面刷新速度的方法

什么是桌面刷新速度呢? 电脑用久了桌面的文件肯定越来越多，所以我们用F5刷新，但是有时发现刷新都要等好久，而相比之...

10-20

北京400电话怎么申请（北京400电话怎么申请费用）

【北京400电话怎么申请】北京400电话业务是一种主被叫分摊付费业务，即400话费由企业和拨打400电话的用户分摊，拨打方仅支...

11-07

市民巧用百度地图标注掐点乘公交

第118届广交会4日下午在广州落幕，随后广州城市道路交通逐步恢复到朝八晚六的迟早顶峰常态。不过，包含第13届国际车展在...

04-13

400电话应用之电商行业

随着互联网时代的发展，越来越多的人喜欢上网购物。有些企业在线上的销售额已经远远的超过了实体店。电子商务如火如荼...

01-13

湖南省外呼电话机器人（外呼机器人市场排名）

本文目录一览：1、ai机器人外呼系统2、长沙电话自动外呼系统哪家线路多?卡信科技最多吗?3、外呼系统,智能外呼机器人好处...

08-28

Aspect：满足新一代员工的期望

Maddy Hubbard，Aspect数字营销内容经理本周，我的女儿即将毕业。上高中她的这份全职工作结束了，她在计划人生的下一个篇章...

10-19

信阳营销电销机器人供应商（信阳营销电销机器人供应商电话）

本文目录一览： 1、电销机器人哪家的靠谱？ 2、电销机器人都有哪些性价比高的品牌？ 3、电销机器人真的那么好用吗哪家...

11-25

山东电话机器人供应商排名（山东电话机器人供应商排名榜）

本文目次一览： 1、中国/国际合作呆板人十年夜品牌是哪十年夜品牌？ 2、中国十年夜呆板人公司 3、电销呆板人公司排名，...

11-26

电话营销机器人好不好

外呼机器人是目前智能客服系统中的一项重要功能，也是众多有电销需求企业的刚需。【电话营销机器人好不好】关于哪家...

10-24

只有B站老大才能救A站

A站又刷屏了，因为它的一条官方微博——文化部领导约谈AcFun，要求其整改。距离AB站下架电视剧一周，距离上次A站因为没...

10-16

电话机器人话术流程（电话机器人话术要怎么写）

本文目录一览： 1、智能电话机器人是如何工作的? 2、人工智能电话机器人话术怎么做？ 3、电话机器人到底是怎么工作的？...

11-24

智能外呼系统有什么好处（什么是智能外呼系统）

今天给各位共享智能外呼体系有什么长处的常识，其间也会对什么是智能外呼体系进行解说，如果能可巧处理你现在面对的问...

11-06

杭州ai外呼系统加盟（ai外呼公司）

今天给各位分享杭州ai外呼系统加盟的知识，其中也会对ai外呼公司进行解释，如果能碰巧解决你现在面临的问题，别忘了关...

05-17

扬州云外呼系统供应商（云外呼系统公司哪家好）

本篇文章给咱们谈谈扬州云外呼体系供货商，以及云外呼体系公司哪家好对应的知识点，期望对各位有所帮忙，不要忘了保藏...

11-06

“呼叫中心”是智慧政务建设的重中之重

近些年来，随着科学技术的进步、智慧城市、智慧政务理念的提出，呼叫中心系统也逐渐在政府服务中广泛推广开来。通过...

10-20

关于南通通讯外呼系统是什么的信息

本文目录一览： 1、能够简略说一下外呼体系是什么吗？2、什么是智能外呼体系？3、什么是网络电话外呼体系？4、什么叫智...

04-22

百度地图标注2017春节出行秘籍：接送机单单立减50元？

1603 随着春运模式的开启，春运大戏又开始在各地轮番上演：拼手速、斗黄牛、躲拥堵、自驾行到处都是人人从从从众众众。...

04-14

400电话谁家专业的

400电话谁家专业的呢?是国内最早从事400业务的专业公司，10多年来，始终坚持诚信、规范、友善，引领行业方向，它是专业的...

05-09

打400电话收费标准打400的电话要收费吗

打400电话收费标准打400的电话要收费吗以下内容由巨人小编整理发布。现在办理400电话，网上经常会出现免费办理的信息，...

05-16

你们公司资费套餐是否透明？（）

在400电话申请办理后是不是会有一个强大的400电话平台提供，工伟科技是免费提供的，我们旨在让企业朋友更好的用上400电...

11-07

想要事业变得更加辉煌,就选择有实力的400电话办理平台

一个企业如果想要变强变大,那么我们首先要去了解顾客所需要的产品,而且还需要为顾客提供国际性的服务标准,才能够达到一...

05-09

南京机器人智能外呼系统怎么样（南京机器人展示体验馆）

本篇文章给我们谈谈南京机器人智能外呼体系怎么样，以及南京机器人展现体会馆对应的知识点，期望对各位有所协助，不要...

06-12

400电话是如何实现的济宁400电话有哪些功能

400电话后台管理有哪些功能:1)智能转接:解决企业多部电话难以记忆,销售电话占线、无人接听,客户咨询无人受理而丢单的烦恼...

01-13

海口智能外呼系统供应商（海口智能外呼系统供应商排名）

本文目录一览： 1、外呼体系哪家公司做得好？？？ 2、网络电话外呼体系哪个好？ 3、被动人工智能外呼体系哪家好？ 4、此...

11-25

一篇文章带你深入了解Mysql触发器

目录 1.对SC表进行插入或修改时，如果考试成绩不在0-100范围内时，则撤销插入或修改操作。 2.对SC表进行插入时，如果学生的...

10-18

天津教育呼叫中心软件怎么办理,电话系统-浅析

天津教育呼叫中心软件怎么办理,电话系统在电销机器人拨打之后，我们通过查看通话记录结果或者由人工进行二次触达时，...

12-17

报告揭示后疫情时代联络中心的光明前景

尽管2020年迫使呼叫中心发生了许多快速的文化、物理和技术变革，但Observe。AI发布的一份新报告显示，大多数联络中心的领...

10-21

大连电销卡办理（大连电销卡办理地点）

本文目录一览：1、电销卡怎么办理2、长期稳定防封的电销卡有哪种?做电销用的专业电销卡归属地全国的...3、不留痕电话卡...

07-10

东营电销机器人方案（电销机器人电销机器人）

本文目录一览： 1、电销机器人的操作 *** ，怎么用？2、请电销机器人有什么功能，可以做什么？3、电销机器人有什么功能？...

11-27

青岛财税电销线路费用,电话销售系统怎么办理-终于知道

青岛财税电销线路费用,电话销售系统怎么办理分钟成本根据4PS标准公司定义：分钟成本=联络中心的全部费用/(业务处理总时...

12-16

中国联通400电话客服400电话是联通的吗?

400电话客户服务非常重要。首先，公司应该有自己的客户服务。申请400电话更有意义。当然，如果是企业热线，也需要申请...

01-12

详解GaussDB(DWS) explain分布式执行计划的示例

10-18

本页收集关于详解GaussDB(DWS) explain分布式执行计划的示例的相关信息资讯供网民参考！

下一篇：SQL SERVER迁移之更换磁盘文件夹的完整步骤

一起分享吧