zoukankan      html  css  js  c++  java
  • Hierarchical query-层次查询之START WITH CONNECT BY用法

    Hierarchical query-层次查询中start with...connect by prior子句用法;

    connect by 是结构化查询中用到的,其基本语法是: 
    select ... from tablename start with 条件1 
    connect by 条件2 
    where 条件3; 
    例: 
    select level,empno,ename,job,mgr  from emp 

    start with empno=7566 or empno=7788

    connect by prior empno=mgr;

    简单说来是将一个树状结构存储在一张表里,比如一个表中存在两个字段: 
    org_id,parent_id那么通过表示每一条记录的parent是谁,就可以形成一个树状结构。 
    用上述语法的查询可以取得这棵树的所有记录。 
    其中: 
    条件1 是根结点的限定语句,也可以放在CONNECT BY后面。它后面所跟的就是递归的种子,也就是递归开始的地方;当然可以放宽限定条件,以取得多个根结点,实际就是多棵树。 
    条件2 是连接条件,其中用PRIOR表示上一条记录,比如 CONNECT BY PRIOR org_id = parent_id就是说上一条记录的org_id 是本条记录的parent_id,即本记录的父亲是上一条记录。 
    条件3 是过滤条件,用于对返回的所有记录进行过滤。

    简单介绍如下: 
         早扫描树结构表时,需要依此访问树结构的每个节点,一个节点只能访问一次,其访问的步骤如下: 
         第一步:从根节点开始; 
         第二步:访问该节点; 
         第三步:判断该节点有无未被访问的子节点,若有,则转向它最左侧的未被访问的子节,并执行第二步,否则执行第四步; 
         第四步:若该节点为根节点,则访问完毕,否则执行第五步; 
         第五步:返回到该节点的父节点,并执行第三步骤。 

    扫描整个树结构的过程也即是顺序遍历树的过程。 

     1. 树结构的描述 

    树结构的数据存放在表中,数据之间的层次关系即父子关系,通过表中的列与列间的关系来描述,如EMP表中的EMPNO和MGR。EMPNO表示该雇员的编号,MGR表示领导该雇员的人的编号,即子节点的MGR值等于父节点的EMPNO值。在表的每一行中都有一个表示父节点的MGR(除根节点外),通过每个节点的父节点,就可以确定整个树结构。 
    在SELECT命令中使用CONNECT BY 和START WITH 子句可以查询表中的树型结构关系。其命令格式如下: 
    SELECT 。。。 CONNECT BY {PRIOR 列名1=列名2|列名1=PRIOR 裂名2}    [START WITH]; 
    其中:CONNECT BY子句说明每行数据将是按层次顺序检索,并规定将表中的数据连入树型结构的关系中。PRIORY运算符必须放置在连接关系的两列中某一个的前面。对于节点间的父子关系,PRIOR运算符在一侧表示父节点,在另一侧表示子节点,从而确定查找树结构是的顺序是自顶向下还是自底向上。在连接关系中,除了可以使用列名外,还允许使用列表达式。START WITH 子句为可选项,用来标识哪个节点作为查找树型结构的根节点。若该子句被省略,则表示所有满足查询条件的行作为根节点。 
    START WITH: 不但可以指定一个根节点,还可以指定多个根节点。 指定多个根节点可以用or

    2. 关于PRIOR 

    运算符PRIOR被放置于等号前后的位置,决定着查询时的检索顺序。 PRIOR后的字段也指定一个开始的节点;PRIOR在等号哪侧,哪侧是根节点/父节点。

    若prior缺省,则只能查询到符合条件的起始行,并不进行递归查询;
    PRIOR被置于CONNECT BY子句中等号的前面时,则强制从根节点到叶节点的顺序检索,即由父节点向子节点方向通过树结构,我们称之为自顶向下的方式。如: 
    SCOTT@bys1>select level,empno,ename,job,mgr  from emp  start with empno=7566 or empno=7788 connect by prior empno=mgr;

    SCOTT@bys1>select level,empno,ename,job,mgr  from emp  connect by prior empno=mgr start with  empno=7566 or empno=7788;

         LEVEL      EMPNO ENAME      JOB              MGR
    ---------- ---------- ---------- --------- ----------
             1       7788 SCOTT      ANALYST         7566
             2       7876 ADAMS      CLERK           7788
             1       7566 JONES      MANAGER         7839
             2       7788 SCOTT      ANALYST         7566
             3       7876 ADAMS      CLERK           7788
             2       7902 FORD       ANALYST         7566
             3       7369 SMITH      CLERK           7902

    PIROR运算符被置于CONNECT BY 子句中等号的后面时,则强制从叶节点到根节点的顺序检索,即由子节点向父节点方向通过树结构,我们称之为自底向上的方式。例如: 

    SCOTT@bys1>select level,empno,ename,job,mgr  from emp  start with empno=7788 connect by empno=priormgr;
         LEVEL      EMPNO ENAME      JOB              MGR
    ---------- ---------- ---------- --------- ----------
             1       7788 SCOTT      ANALYST         7566
             2       7566 JONES      MANAGER        7839
             3       7839 KING       PRESIDENT

    3. 定义查找起始节点 

         在自顶向下查询树结构时,不但可以从根节点开始,还可以定义任何节点为起始节点,以此开始向下查找。这样查找的结果就是以该节点为开始的结构树的一枝。 

    4.使用LEVEL 

    在具有树结构的表中,每一行数据都是树结构中的一个节点,由于节点所处的层次位置不同,所以每行记录都可以有一个层号。层号根据节点与根节点的距离确定。不论从哪个节点开始,该起始根节点的层号始终为1,根节点的子节点为2, 依此类推。 

    5.节点和分支的裁剪 

    在对树结构进行查询时,可以去掉表中的某些行,也可以剪掉树中的一个分支,使用WHERE子句来限定树型结构中的单个节点,以去掉树中的单个节点,但它却不影响其后代节点(自顶向下检索时)或前辈节点(自底向顶检索时)。 

    6.排序显示 

    象在其它查询中一样,在树结构查询中也可以使用ORDER BY 子句,改变查询结果的显示顺序,而不必按照遍历树结构的顺序

    二、使用WHERE或CONNECT BY子句中增加条件来修剪树枝和节点:

    借用一张图:

    从图中可以看到,使用WHERE字句删除的只是单个节点,节点下的树结构依然存在。

    而在CONNECT BY中通过增加条件,可以删除节点及节点下的树结构。

    如下两条SQL语句:

    SCOTT@bys1>select level,empno,ename,job,mgr  from emp start with mgr is null connect by prior empno=mgr;
         LEVEL      EMPNO ENAME      JOB              MGR
    ---------- ---------- ---------- --------- ----------
             1       7839 KING       PRESIDENT
             2       7566 JONES      MANAGER         7839
             3       7788 SCOTT      ANALYST         7566
             4       7876 ADAMS      CLERK           7788
             3       7902 FORD       ANALYST         7566
             4       7369 SMITH      CLERK           7902
             2       7698 BLAKE      MANAGER         7839
             3       7499 ALLEN      SALESMAN        7698
             3       7521 WARD       SALESMAN        7698
             3       7654 MARTIN     SALESMAN        7698
             3       7844 TURNER     SALESMAN        7698
             3       7900 JAMES      CLERK           7698
             2       7782 CLARK      MANAGER         7839
             3       7934 MILLER     CLERK           7782
    使用WHERE过滤,可以看到empno=7788的行没显示,empno=7788行的子节点显示了

    SCOTT@bys1>select level,empno,ename,job,mgr  from emp where empno!=7566 start with mgr is null connect by prior empno=mgr;

         LEVEL      EMPNO ENAME      JOB              MGR
    ---------- ---------- ---------- --------- ----------
             1       7839 KING       PRESIDENT
             3       7788 SCOTT      ANALYST         7566
             4       7876 ADAMS      CLERK           7788
             3       7902 FORD       ANALYST         7566
             4       7369 SMITH      CLERK           7902
             2       7698 BLAKE      MANAGER         7839
             3       7499 ALLEN      SALESMAN        7698
             3       7521 WARD       SALESMAN        7698
             3       7654 MARTIN     SALESMAN        7698
             3       7844 TURNER     SALESMAN        7698
             3       7900 JAMES      CLERK           7698
             2       7782 CLARK      MANAGER         7839
             3       7934 MILLER     CLERK           7782

    13 rows selected.
    可以用WHERE过滤年根节点的7839 KING,其它子节点的员工可以显示。
    SCOTT@bys1>select level,empno,ename,job,mgr  from emp where empno!=7839 start with mgr is null connect by prior empno=mgr;
         LEVEL      EMPNO ENAME      JOB              MGR
    ---------- ---------- ---------- --------- ----------
             2       7566 JONES      MANAGER         7839
             3       7788 SCOTT      ANALYST         7566
             4       7876 ADAMS      CLERK           7788
             3       7902 FORD       ANALYST         7566
             4       7369 SMITH      CLERK           7902
             2       7698 BLAKE      MANAGER         7839
             3       7499 ALLEN      SALESMAN        7698
             3       7521 WARD       SALESMAN        7698
             3       7654 MARTIN     SALESMAN        7698
             3       7844 TURNER     SALESMAN        7698
             3       7900 JAMES      CLERK           7698
             2       7782 CLARK      MANAGER         7839
             3       7934 MILLER     CLERK           7782
    13 rows selected.


    使用CONNECT BY中的条件,empno!=7566;将此条数据和属于它的子节点都过滤了。

    SCOTT@bys1>select level,empno,ename,job,mgr  from emp start with mgr is null connect by prior empno=mgr andempno!=7566;
         LEVEL      EMPNO ENAME      JOB              MGR
    ---------- ---------- ---------- --------- ----------
             1       7839 KING       PRESIDENT
             2       7698 BLAKE      MANAGER         7839
             3       7499 ALLEN      SALESMAN        7698
             3       7521 WARD       SALESMAN        7698
             3       7654 MARTIN     SALESMAN        7698
             3       7844 TURNER     SALESMAN        7698
             3       7900 JAMES      CLERK           7698
             2       7782 CLARK      MANAGER         7839
             3       7934 MILLER     CLERK           7782
    9 rows selected.
    使用CONNECT BY中的条件,empno!=7839;来过滤7839 KING,发现并没有将此节点及所有子节点过滤。--可能是都过滤了语句就没意义了。
    SCOTT@bys1>select level,empno,ename,job,mgr  from emp start with mgr is null connect by prior empno=mgr and empno!=7839;

         LEVEL      EMPNO ENAME      JOB              MGR
    ---------- ---------- ---------- --------- ----------
             1       7839 KING       PRESIDENT
             2       7566 JONES      MANAGER         7839
             3       7788 SCOTT      ANALYST         7566
             4       7876 ADAMS      CLERK           7788
             3       7902 FORD       ANALYST         7566
             4       7369 SMITH      CLERK           7902
             2       7698 BLAKE      MANAGER         7839
             3       7499 ALLEN      SALESMAN        7698
             3       7521 WARD       SALESMAN        7698
             3       7654 MARTIN     SALESMAN        7698
             3       7844 TURNER     SALESMAN        7698
             3       7900 JAMES      CLERK           7698
             2       7782 CLARK      MANAGER         7839
             3       7934 MILLER     CLERK           7782
    14 rows selected.

    三、关于层次查询的执行计划和性能探讨

    有的文档中说到层次查询会多次访问表来执行递归查询。通过执行下面两条SQL语句及执行计划来看,执行计划并没有多次访问。---是语句不够复杂?

    在CONNECT BY中加入过滤条件,从执行计划可以看到执行一次全表扫描,然后用CONNECT BY中过滤条件进行过滤。

    BYS@bys1>select level,empno,ename,job,mgr  from scott.emp start with mgr is null connect by prior empno=mgr and empno!=7839;
         LEVEL      EMPNO ENAME      JOB              MGR
    ---------- ---------- ---------- --------- ----------
             1       7839 KING       PRESIDENT
             2       7566 JONES      MANAGER         7839
             3       7788 SCOTT      ANALYST         7566
             4       7876 ADAMS      CLERK           7788
             3       7902 FORD       ANALYST         7566
             4       7369 SMITH      CLERK           7902
             2       7698 BLAKE      MANAGER         7839
             3       7499 ALLEN      SALESMAN        7698
             3       7521 WARD       SALESMAN        7698
             3       7654 MARTIN     SALESMAN        7698
             3       7844 TURNER     SALESMAN        7698
             3       7900 JAMES      CLERK           7698
             2       7782 CLARK      MANAGER         7839
             3       7934 MILLER     CLERK           7782
    14 rows selected.
    Elapsed: 00:00:00.01

    Execution Plan
    ----------------------------------------------------------
    Plan hash value: 763482334
    ------------------------------------------------------------------------------------------------
    | Id  | Operation                               | Name | Rows  | Bytes | Cost (%CPU)| Time     |
    ------------------------------------------------------------------------------------------------
    |   0 | SELECT STATEMENT                        |      |    14 |   546 |     4  (25)| 00:00:01 |
    |*  1 |  CONNECT BY NO FILTERING WITH START-WITH|      |       |       |            |          |
    |   2 |   TABLE ACCESS FULL                     | EMP  |    14 |   308 |     3   (0)| 00:00:01 |
    ------------------------------------------------------------------------------------------------
    Predicate Information (identified by operation id):
    ---------------------------------------------------
       1 - access("MGR"=PRIOR "EMPNO")
           filter("EMPNO"<>7839 AND "MGR" IS NULL)
    Statistics
    ----------------------------------------------------------
              0  recursive calls
              0  db block gets
              7  consistent gets
              0  physical reads
              0  redo size
           1032  bytes sent via SQL*Net to client
            419  bytes received via SQL*Net from client
              2  SQL*Net roundtrips to/from client
              2  sorts (memory)
              0  sorts (disk)
             14  rows processed

    使用WHERE来过滤指定节点的执行计划,同使用仅CONNECT BY过滤类似。

    从执行计划可以看到执行一次全表扫描,然后用CONNECT BY中过滤条件进行过滤,再用WHERE中条件过滤。
    BYS@bys1>select level,empno,ename,job,mgr  from scott.emp where empno!=7839 start with mgr is null connect by prior empno=mgr;

         LEVEL      EMPNO ENAME      JOB              MGR
    ---------- ---------- ---------- --------- ----------
             2       7566 JONES      MANAGER         7839
             3       7788 SCOTT      ANALYST         7566
             4       7876 ADAMS      CLERK           7788
             3       7902 FORD       ANALYST         7566
             4       7369 SMITH      CLERK           7902
             2       7698 BLAKE      MANAGER         7839
             3       7499 ALLEN      SALESMAN        7698
             3       7521 WARD       SALESMAN        7698
             3       7654 MARTIN     SALESMAN        7698
             3       7844 TURNER     SALESMAN        7698
             3       7900 JAMES      CLERK           7698
             2       7782 CLARK      MANAGER         7839
             3       7934 MILLER     CLERK           7782

    13 rows selected.
    Elapsed: 00:00:00.01
    Execution Plan
    ----------------------------------------------------------
    Plan hash value: 3008947215
    -------------------------------------------------------------------------------------------------
    | Id  | Operation                                | Name | Rows  | Bytes | Cost (%CPU)| Time     |
    -------------------------------------------------------------------------------------------------
    |   0 | SELECT STATEMENT                         |      |    14 |   546 |     4  (25)| 00:00:01 |
    |*  1 |  FILTER                                  |      |       |       |            |          |
    |*  2 |   CONNECT BY NO FILTERING WITH START-WITH|      |       |       |            |          |
    |   3 |    TABLE ACCESS FULL                     | EMP  |    14 |   308 |     3   (0)| 00:00:01 |
    -------------------------------------------------------------------------------------------------
    Predicate Information (identified by operation id):
    ---------------------------------------------------
       1 - filter("EMPNO"<>7839)
       2 - access("MGR"=PRIOR "EMPNO")
           filter("MGR" IS NULL)
    Statistics
    ----------------------------------------------------------
              1  recursive calls
              0  db block gets
              7  consistent gets
              0  physical reads
              0  redo size
           1004  bytes sent via SQL*Net to client
            419  bytes received via SQL*Net from client
              2  SQL*Net roundtrips to/from client
              2  sorts (memory)
              0  sorts (disk)
             13  rows processed

  • 相关阅读:
    cmake安装配置及入门指南
    【算法篇】栈和队列专题之广度优先遍历和深度优先遍历
    【算法篇】链表专题
    【Android】JDK8标准下计算两个日期的时间差
    【MatLab】图片的拼接、滤色
    【C#】Winform开发笔记(持续更新)
    【Java】解决中文在post/get请求乱码的问题
    【C#】基于TCP的简单通信系统
    【Java】IDEA创建Web项目以及Tomcat配置
    【Java】模拟登录教务网并获取数据
  • 原文地址:https://www.cnblogs.com/suncoolcat/p/3402522.html
Copyright © 2011-2022 走看看