zoukankan      html  css  js  c++  java
  • hint使用

     hint提示的相关介绍

    参考

    http://wenku.baidu.com/view/8df8aa68a98271fe910ef9f6.html;
    http://www.blogjava.net/wxqxs/archive/2008/08/13/221716.html


    介绍hint的使用之前先了解RBO和CBO
    Oracle的优化器的RBO和CBO方式
    1、基于规则的优化方式(Rule-Based Optimization,简称为RBO)
        优化器在分析SQL语句时,所遵循的是Oracle内部预定的一些规则,对数据是不敏感的。它只借助少量的信息来决定一个sql语句的执行计划,包括:
        1)sql语句本身
        2)sql中涉及到的table、view、index等的基本信息
        3)本地数据库中数据字典中的信息(远程数据库数据字典信息对RBO是无效的)
        例如:我们常见的,当一个where子句中的一列有索引时去走索引。但是需要注意,走索引不一定就是优的,比如一个表只有两行数据,一次IO就可以完成全表的检索,而此时走索引时则需要两次IO,这时全表扫描(full table scan)的效率更优。

    2、基于代价的优化方式(Cost-Based Optimization,简称为CBO)

        它是看语句的代价(Cost),通过代价引擎来估计每个执行计划所需的代价,该代价将每个执行计划所耗费的资源进行量化,CBO根据这个代价选择出最优的执行计划。一个查询所耗费的资源可分为三部分:I/O代价、CPU代价、NETWORK代价。I/O是指把数据从磁盘读入内存时所需代价(该代价是查询所需最主要的,所以在优化时一个基本原则就是降低I/O总次数);CPU代价是指处理内存中数据所需的代价,数据一旦读入内存,当我们识别出我们所要的数据后,会在这些数据上执行排序(sort)或连接(join)操作,这需要消耗CPU资源;对于访问远程节点来说,network代价的花费也是很大的。
        优化器在判断是否用这种方式时,主要参照的是表及索引的统计信息。统计信息给出表的大小、有多少行、每行的长度等信息。这些统计信息起初在库内是没有的,是做analyze后才出现的,很多的时侯过期统计信息会令优化器做出一个错误的执行计划,因些应及时更新这些信息(dbms_stat.analyze)。
        如星型连接排列查询,哈希连接查询,函数索引,和并行查询等一些技术都是基于CBD的。

    使用hint的注意事项:
    提示(hint)从Oracle7中引入,目的是弥补基于成本优化器的缺陷。提示通常用来改变SQL执行计划,提高执行效率。
    1.使用提示需要遵循的原则
      1)仔细检查提示语法。尽量使用完整注释语法/*+ hint */
      2)使用表别名。如果在查询中指定了表别名,那么提示必须也使用表别名。例如:select /*+ index(e,dept_idx) */ * from emp e;
      3)不要在提示中使用模式名称:如果在提示中指定了模式的所有者,那么提示将被忽略。例如:
        select /*+ index(scott.emp,dept_idx) */ * from emp;
      4)检验提示。如果提示指定了不可用的访问路径,那么这个提示将被忽略。

    2.导致提示无效的条件:
      1)cluster 与非簇表一同使用
      2)hash 与非簇表一同使用
      3)hash_aj 不存在子查询
      4)index 指定的索引不存在
      5)index_combine 不存在位图索引
      6)merge_aj 不存在子查询
      7)parallel 调用的不是TABLE ACCESS FULL计划
      8)push_subq 不存在子查询
      9)star 事实表中存在不恰当的索引
      10)use_concat 在where子句中不存在多个or条件
      11)use_nl 表中不存在索引

    3.几种主要的优化模式:
      优化模式包括Rule、Choose、First rows、All rows四种方式:
        Rule:基于规则的方式。
        Choolse:默认的情况下Oracle用的便是这种方式。指的是当一个表或或索引有统计信息,则走CBO的方式,如果表或索引没统计信息,表又不是特别的小,而且相应的列有索引时,那么就走索引,走RBO的方式。
        First Rows:它与Choose方式是类似的,所不同的是当一个表有统计信息时,它将是以最快的方式返回查询的最先的几行,从总体上减少了响应时间。
        All Rows:也就是我们所说的Cost的方式,当一个表有统计信息时,它将以最快的方式返回表的所有的行,从总体上提高查询的吞吐量。没有统计信息则走RBO的方式。

    4.表的连接提示
      1)use_hash提示
        use_hash 提示对指定的表进行散列连接。散列连接是Oracle用以驱动表(最小的表)向RAM区中装载记录的方法,RAM区由HASH_AREA_SIZE定义。
        散列连接适合中间结果比较大的情况。使用散列连接时,HASH_AREA_SIZE对速度影响非常大,如果驱动表不能一次装入内存,那么需要使用TEMP表
        空间,这种情况下速度比较慢。这个参数可以在session级别动态修改,需要进行散列连接时可以临时增大,速度可能显著增加。
      2)use_merge 提示
        use_merge 提示强制执行一个排序合并操作。排序合并操作通常与并行查询结合使用,因为排序合并操作倾向于全表扫描。该提示适合于生成大型结果集的查询。
      3)use_nl:
        use_nl提示将强制对目标表执行嵌套循环连接。use_nl提示很少用于SQL调整,因为CBO和RBO更倾向于使用循环嵌套连接。
      4)star提示
        star 提示强制使用星型查询计划。前提是查询中至少三个表,而且在事实表中存在恰当的索引

    5.表反连接提示
      SQL反连接是指在语句中包含NOT IN 或者NOT EXISTS子句时执行的操作。
     1)merge_aj
      在使用全表访问比索引访问更好的情况下,可以在NOT IN子查询中使用merge_aj提示以便执行反连接。
     2)hash_aj
       hash_aj 提示放在NOT IN 子查询中用来希望执行散列连接时,执行散列反连接。hash_aj和merge_aj要求子查询列非空。

    6.INDEX提示
      1)INDEX提示简介:
        INDEX提示被用于显示指定表名或表名与索引。如果只指定了表名,那么优化器将使用表中的"最优"索引。在永久优化SQL语句中,建议指定表和索引。
      2)index_join 提示
        index_join 提示明确要求优化器使用索引连接来作为访问路径。
      3)and_equal 提示
        and_equal 提示可以使多个非唯一的索引合并索引,并且使这些索引操作时就象单个连续索引一样。该提示如果被应用,在查询计划中显示的是AND-EQUAL
      4)index_asc 提示
        index_asc 提示使用升序索引。这是默认的优化器行为
      5)no_index 提示
        该提示忽略索引存在,类似full
      6)index_combine提示
        index_combine 提示用来强制使用位图索引作为表的访问路径。
      7)index_ffs提示
        索引快速完全扫描可以在不访问任何记录的情况下完成查询。
      8)use_concat提示
        use_concat提示要求为所有的OR条件使用UNION ALL执行计划,并将这个查询重新书写为多个查询。如果在WHERE子句中存在大量OR条件,可以考虑使用use_concat提示。

    7.总结

      1)因为提示放在注释中,所以如果提示通现存的执行计划不兼容,或者提示不正确,有可能被忽略。
      2)在使用RBO时,可以通过提示将指定的查询更改为CBO。切记要对查询中涉及的所有表和索引进行分析
      3)在使用CBO的时候,可以通过添加RULE提示或者FIRST_ROWS提示来开始调整一个可以的SQL语句
      4)提示可以在子查询中使用,但是外部查询的提示不会带入子查询。
      5)如果在查询计划中发现卡笛尔积(CARTESIAN),则要尽量解决。

    在SQL优化过程中常见Oracle HINT的用法:
    1. /*+ALL_ROWS*/
     表明对语句块选择基于开销的优化方法,并获得最佳吞吐量,使资源消耗最小化.
     SELECT /*+ALL_ROWS*/ * from i_exch_s WHERE districtid=1116;
     
    2. /*+FIRST_ROWS*/
     表明对语句块选择基于开销的优化方法,并获得最佳响应时间,使资源消耗最小化.
     SELECT /*+FIRST_ROWS*/ * from i_exch_s WHERE districtid=1116;
     
    3. /*+CHOOSE*/
     表明如果数据字典中有访问表的统计信息,将基于开销的优化方法,并获得最佳的吞吐量;
     表明如果数据字典中没有访问表的统计信息,将基于规则开销的优化方法;
     SELECT /*+CHOOSE*/ * from i_exch_s WHERE districtid=1116;
     
    4. /*+RULE*/
     表明对语句块选择基于规则的优化方法.
     SELECT /*+ RULE */ * from i_exch_s WHERE districtid=1116;

    5. /*+FULL(TABLE)*/
     表明对表选择全局扫描的方法.
     SELECT /*+FULL(A)*/ * from i_exch_s a WHERE districtid=1116;

    6. /*+ROWID(TABLE)*/
     提示明确表明对指定表根据ROWID进行访问.
     SELECT /*+ROWID(i_exch_s)*/ * from i_exch_s WHERE ROWID>='AAATf0AALAABp2NAAM'AND districtid=1116;

    7. /*+CLUSTER(TABLE)*/
     提示明确表明对指定表选择簇扫描的访问方法,它只对簇对象有效.
     SELECT /*+CLUSTER */ emp.empno,dept.deptno from emp,dept WHERE emp.deptno=dept.deptno;

    8. /*+INDEX(TABLE INDEX_NAME)*/
     表明对表选择索引的扫描方法.
     SELECT /*+INDEX(i_exch_s gwm_fid)*/* from i_exch_s WHERE gwm_fid=50076211;

    9. /*+INDEX_ASC(TABLE INDEX_NAME)*/
     表明对表选择索引升序的扫描方法.
     SELECT /*+INDEX_ASC(i_exch_s gwm_fid)*/ * from i_exch_s WHERE gwm_fid=50076211;

    10. /*+INDEX_COMBINE*/
     为指定表选择位图访问路经,如果INDEX_COMBINE中没有提供作为参数的索引,将选择出位图索引的布尔组合方式.
     SELECT /*+INDEX_COMBINE(BSEMPMS SAL_BMI HIREDATE_BMI)*/ * from BSEMPMS WHERE SAL<5000000 AND HIREDATE

    11. /*+INDEX_JOIN(TABLE INDEX_NAME)*/
     提示明确命令优化器使用索引作为访问路径.
     SELECT /*+INDEX_JOIN(i_exch_s gwm_fid GWM_EDITDATE)*/ gwm_fid,GWM_EDITDATE from i_exch_s WHERE gwm_fid<50076211;

    12. /*+INDEX_DESC(TABLE INDEX_NAME)*/
     表明对表选择索引降序的扫描方法.
     SELECT /*+INDEX_DESC(i_exch_s gwm_fid)*/ * from i_exch_s WHERE gwm_fid=50076211;

    13. /*+INDEX_FFS(TABLE INDEX_NAME)*/
     对指定的表执行快速全索引扫描,而不是全表扫描的办法.
     SELECT /*+INDEX_FFS(i_exch_s gwm_fid)*/ * from i_exch_s WHERE gwm_fid=50076211;

    14. /*+ADD_EQUAL TABLE INDEX_NAM1,INDEX_NAM2,...*/
     提示明确进行执行规划的选择,将几个单列索引的扫描合起来.
     SELECT /*+ADD_EQUAL(i_exch_s gwm_fid,GWM_EDITDATE,DELETETAG)*/ * from i_exch_s WHERE gwm_fid=50076211;

    15. /*+USE_CONCAT*/
     对查询中的WHERE后面的OR条件进行转换为UNION ALL的组合查询.
     SELECT /*+USE_CONCAT*/ * from i_exch_s WHERE gwm_fid=50076211 or districtid=1116;

    16. /*+NO_EXPAND*/
     对于WHERE后面的OR 或者IN-LIST的查询语句,NO_EXPAND将阻止其基于优化器对其进行扩展.
     SELECT /*+NO_EXPAND*/ * from i_exch_s WHERE gwm_fid=50076211 or districtid=1116;

    17. /*+NOWRITE*/
     禁止对查询块的查询重写操作.
     SELECT /*+NO_EXPAND*/ * from i_exch_s WHERE gwm_fid=50076211;
     
    18. /*+REWRITE*/
     可以将视图作为参数.
     SELECT /*+NO_EXPAND*/ * from vi_exch_s WHERE gwm_fid=50076211;
     
    19. /*+MERGE(TABLE)*/
    能够对视图的各个查询进行相应的合并.
    select /*+MERGE(V) */ C.GWM_FNO,C.GWM_FID,C.GWM_CNO,v.NAME
      FROM i_exch_s C,(select a.name,a.gwm_fno,a.gwm_fid from i_exch_info a group by gwm_fno,name,gwm_fid) v
      WHERE v.GWM_FID=C.GWM_FID;

    20. /*+NO_MERGE(TABLE)*/
     对于有可合并的视图不再合并.
    select /*+NO_MERGE(V) */ C.GWM_FNO,C.GWM_FID,C.GWM_CNO,v.NAME
      FROM i_exch_s C,(select a.name,a.gwm_fno,a.gwm_fid from i_exch_info a group by gwm_fno,name,gwm_fid) v
      WHERE v.GWM_FID=C.GWM_FID;
     
    21. /*+ORDERED*/
     根据表出现在from中的顺序,ORDERED使ORACLE依此顺序对其连接.
     SELECT /*+ORDERED*/ A.COL1,B.COL2,C.COL3 from TABLE1 A,TABLE2 B,TABLE3 C WHERE A.COL1=B.COL1 AND B.COL1=C.COL1;

    22. /*+USE_NL(TABLE)*/
     将指定表与嵌套的连接的行源进行连接,并把指定表作为内部表.
     SELECT /*+ORDERED USE_NL(i_exch_info)*/ a.g3e_fno,b.gwm_fid,b.name from i_exch_info a,i_exch_s b WHERE a.g3e_fid=b.gwm_fid;

    23. /*+USE_MERGE(TABLE)*/
     将指定的表与其他行源通过合并排序连接方式连接起来.
     SELECT /*+USE_MERGE(i_exch_info,i_exch_s)*/ * from i_exch_info a,i_exch_s b WHERE a.g3e_fid=b.gwm_fid;

    24. /*+USE_HASH(TABLE)*/
     将指定的表与其他行源通过哈希连接方式连接起来.
     SELECT /*+USE_HASH(i_exch_info,i_exch_s)*/ * from i_exch_info a,i_exch_s b WHERE a.g3e_fid=b.gwm_fid;

    25. /*+DRIVING_SITE(TABLE)*/
     强制与ORACLE所选择的位置不同的表进行查询执行.
     SELECT /*+DRIVING_SITE(b)*/ * from i_exch_info a,i_exch_s@igisdb b WHERE a.g3e_fid=b.g3e_fid;

    26. /*+LEADING(TABLE)*/
     将指定的表作为连接次序中的首表.

    27. /*+CACHE(TABLE)*/
     当进行全表扫描时,CACHE提示能够将表的检索块放置在缓冲区缓存中最近最少列表LRU的最近使用端
     SELECT /*+FULL(BSEMPMS) CAHE(BSEMPMS) */ EMP_NAM from BSEMPMS;

    28. /*+NOCACHE(TABLE)*/
     当进行全表扫描时,CACHE提示能够将表的检索块放置在缓冲区缓存中最近最少列表LRU的最近使用端
     SELECT /*+FULL(BSEMPMS) NOCAHE(BSEMPMS) */ EMP_NAM from BSEMPMS;

    29. /*+APPEND*/
     直接插入到表的最后,可以提高速度.
     insert /*+append*/ into test1 select * from test4 ;

    30. /*+NOAPPEND*/
     通过在插入语句生存期内停止并行模式来启动常规插入.
     insert /*+noappend*/ into test1 select * from test4 ;
     
    设定选用哪种优化模式:

        A、在initSID.ora中设定OPTIMIZER_MODE=RULE/CHOOSE/FIRST_ROWS/ALL_ROWS(默认是Choose)
        B、Sessions级别通过:ALTER SESSION SET OPTIMIZER_MODE=RULE/CHOOSE/FIRST_ROWS/ALL_ROWS
        C、语句级别用Hint(/*+ ... */)来设定


    一些常见的问题:
      A、为什么表的某个字段明明有索引,但执行计划却不走索引?
        1、优化模式是all_rows的方式
        2、表作过analyze,有统计信息
        3、表很小,上文提到过的,Oracle的优化器认为不值得走索引。

      B、使用CBO时,SQL语句中为什么不能引用系统数据字典表或视图?
        1、因为系统数据字典表都未被分析过,可能导致极差的“执行计划”。
        2、擅自对数据字典表做分析,可能导致死锁,或系统性能严重下降。

      C、使用CBO时如何选择表连接方式?
        1、CBO有时会偏重于SMJ和HJ,但在OLTP系统中,NL一般会更好,因为它高效的使用了索引。
        2、SMJ即使相关列上建有索引,最多只能因索引的存在,避免数据排序过程。
        3、HJ由于须做HASH运算,索引的存在对数据查询速度几乎没有影响。

      D、使用CBO时,需要注意什么吗?
        1、必须保证为表和相关的索引搜集足够的统计数据, 对数据经常有增、删、改的表最好定期对表和索引进行分析
        2、可用SQL语句:analyze table xxx compute statistics for all indexes

      E、为什么有时使用CBO会比较慢?
        1、没有对表或视图进行Analyze
        2、SQL进行CBO时对于没有Analyze的对象会自动进行Analyze,因此造成运行缓慢
     
  • 相关阅读:
    第五章:数组 结构体 和联合体
    第四章:用户自定义和枚举数据类型
    第三章:systemverilog文本值和数据类型
    阶段一:读几本经济学书
    第二章:systemverilog声明的位置
    数据结构-B树
    UDP的崛起
    vim使用
    sudo apt-get update
    计算机组成原理——浮点数表示方法
  • 原文地址:https://www.cnblogs.com/lanzi/p/1945641.html
Copyright © 2011-2022 走看看