zoukankan      html  css  js  c++  java
  • oracle 性能优化--索引总结

    索引是建立在表的一列或多个列上的辅助对象,目的是加快訪问表中的数据;

        Oracle存储索引的数据结构是B*树。位图索引也是如此,仅仅只是是叶子节点不同B*数索引;

        索引由根节点、分支节点和叶子节点组成。上级索引块包括下级索引块的索引数据,叶节点包括索引数据和确定行实际位置的rowid。

    使用索引的目的:

    加快查询速度

    降低I/O操作

    消除磁盘排序

     

    何时使用索引:

    查询返回的记录数

    排序表<40%

    非排序表 <7%

    表的碎片较多(频繁添加、删除)

     

    索引的种类

    非唯一索引(最经常使用)

    唯一索引

    位图索引

    局部有前缀分区索引

    局部无前缀分区索引

    全局有前缀分区索引

    散列分区索引

    基于函数的索引

     

    管理索引的准则

     

    在表中插入数据后创建索引

     

    。在用SQL*Loader或import工具插入或装载数据后。建立索引比較有效;

     

    索引正确的表和列

     

    。常常检索排序大表中40%或非排序表7%的行,建议建索引。

    。为了改善多表关联。索引列用于联结。

    列中的值相对照较唯一;

    。取值范围(大:B*树索引,小:位图索引);

    。Date型列一般适合基于函数的索引;

    列中有很多空值,不适合建立索引

     

    为性能而安排索引列

     

    。常常一起使用多个字段检索记录,组合索引比单索引更有效;

    。把最经常使用的列放在最前面。例:dx_groupid_serv_id(groupid,serv_id),在where条件中使用groupid或groupid,serv_id,查询将使用索引,若仅用到serv_id字段,则索引无效;

    合并/拆分不必要的索引。

     

    限制每一个表索引的数量

     

    一个表能够有几百个索引(你会这样做吗?),可是对于频繁插入和更新表,索引越多系统CPU。I/O负担就越重;

    。建议每张表不超过5个索引。

     

    删除不再须要的索引

     

    。索引无效。集中表如今该使用基于函数的索引或位图索引。而使用了B*树索引。

    。应用中的查询不使用索引;

    。重建索引之前必须先删除索引。若用alter index … rebuild重建索引,则不必删除索引。

     

    索引数据块空间使用

     

    创建索引时指定表空间,特别是在建立主键时,应明白指定表空间。

    合理设定pctfress,注意:不能给索引指定pctused;

    。预计索引的大小和合理地设置存储參数。默觉得表空间大小。或initialnext设置成一样大。

     

    考虑并行创建索引

     

    。对大表能够採用并行创建索引,在并行创建索引时。存储參数被每一个查询服务器进程分别使用,比如:initial1M。并行度为8,则创建索引期间至少要消耗8M空间;

     

    考虑用nologging创建索引

     

    。对大表创建索引能够使用nologging来降低重做日志;

    节省重做日志文件的空间;

    。缩短创建索引的时间;

    。改善了并行创建大索引时的性能。

     

    如何建立最佳索引

     

    明白地创建索引

    create index index_name on table_name(field_name)

    tablespace tablespace_name

    pctfree 5

    initrans 2

    maxtrans 255

    storage

    (

    minextents 1

    maxextents 16382

    pctincrease 0

    );

     

    创建基于函数的索引

     

    。经常使用与UPPER、LOWER、TO_CHAR(date)等函数分类上,例:

    create index idx_func on emp (UPPER(ename)) tablespace tablespace_name;

     

    创建位图索引

     

    。对基数较小。且基数相对稳定的列建立索引时,首先应该考虑位图索引,例:

    create bitmap index idx_bitm on class (classno) tablespace tablespace_name;

     

    明白地创建唯一索引

     

    能够用create unique index语句来创建唯一索引。例:

    create unique index dept_unique_idx on dept(dept_no) tablespace idx_1;

     

    创建与约束相关的索引

     

    。能够用using index字句。为与unique和primary key约束相关的索引,比如:

    alter table table_name

    add constraint PK_primary_keyname primary key (field_name)

    using index tablespace tablespace_name。

     

    怎样创建局部分区索引

     

    。基础表必须是分区表;

    分区数量与基础表同样;

    。每一个索引分区的子分区数量与对应的基础表分区同样;

    。基础表的子分区中的行的索引项,被存储在该索引的对应的子分区中,比如:

    Create Index TG_CDR04_SERV_ID_IDX On TG_CDR04(SERV_ID)

    Pctfree 5

    Tablespace TBS_AK01_IDX

    Storage (

    MaxExtents 32768

    PctIncrease 0

    FreeLists 1

    FreeList Groups 1

    )

    local

    /

     

    怎样创建范围分区的全局索引

     

    。基础表能够是全局表和分区表。

    create index idx_start_date on tg_cdr01(start_date)

    global partition by range(start_date)

    (partition p01_idx vlaues less than (‘0106’)

    partition p01_idx vlaues less than (‘0111’)

    partition p01_idx vlaues less than (‘0401’ ))

    /

     

    重建现存的索引

     

    重建现存的索引的当前时刻不会影响查询;

     

    重建索引能够删除额外的数据块。

     

    提高索引查询效率;

    alter index idx_name rebuild nologging;

     

    对于分区索引:

    alter index idx_name rebuild partition partiton_name nologging;

     

    要删除索引的原因

     

    。不再须要的索引;

    。索引没有针对其相关的表所公布的查询提供所期望的性能改善;

    应用没实用该索引来查询数据;

    。该索引无效。必须在重建之前删除该索引;

    。该索引已经变的太碎了。必须在重建之前删除该索引;

    。语句:drop index idx_name;drop index idx_name drop partition partition_name;

     

    建立索引的代价

     

    基础表维护时,系统要同一时候维护索引,不合理的索引将严重影响系统资源,主要表如今CPU和I/O上;

     

    插入、更新、删除数据产生大量db file sequential read锁等待;

     

    SQL优化器简单介绍

     

    基于规则的优化器

     

    。总是使用索引

    。总是从驱动表開始(from子句最右边的表)

    仅仅有在不可避免的情况下。才使用全表扫描

    。不论什么索引都能够

     

    基于成本的优化器

     

    。须要表、索引的统计资料

    Analyze table customer compute statistics;

    Analyze table customer estimate statistics sample 5000 rows;

    。表中设置并行度、表分区

     

    优化器模式

     

    rule模式

     

    。总忽略CBO和统计信息而基于规则

    choose模式

     

    Oracle依据情况选择rule or first_rows or all_rows

    first_rows 模式

     

    。基于成本,以最快的速度返回记录,会造成整体查询速度的下降或消耗很多其它的资源。倾向索引扫描。适合OLTP系统

    all_rows模式

     

    基于成本。确保整体查询时间最短。倾向并行全表扫描

     

    比如:

    Select last_name from customer order by last_name;用first_rows时。迅速返回记录,但I/O量大。用all_rows时,返回记录慢。但使用资源少。

     

    调整SQL表訪问

     

    全表扫描

     

    。返回记录:未排序表>40%,排序表>7%,建议採用并行机制来提高訪问速度。DDS。

     

    索引訪问

     

    。最经常使用的方法,包含索引唯一扫描和索引范围扫描,OLTP。

     

    高速全然索引扫描

     

    。訪问索引中全部数据块。结果相当于全表扫描。能够用索引扫描取代全表扫描,比如:

     

    Select serv_id,count(* ) from tg_cdr01 group by serv_id;

     

    评估全表扫描的合法性

     

    怎样实现并行扫描

     

    。永久并行化(不推荐)

    alter table customer parallel degree 8;

     

    。单个查询并行化

    select * from emp;

     

    分区表效果明显

     

    优化SQL语句排序

     

    排序的操作:

     

    。order by 子句

    。group by 子句

    select distinct子句

    。创建索引时

    union或minus

    。排序合并连接

     

    怎样避免排序

     

    。加入索引

    。在索引中使用distinct子句

    避免排序合并连接

     

    使用提示进行调整

     

    使用提示的原则

     

    。语法:

    。使用表别名:select * from emp e

    检验提示

     

    经常使用的提示

     

    。rule

    。all_rows

    first_rows

    。use_nl

    use_hash

    。use_merge

    index

    。index_asc

    。no_index

    。index_desc(经常使用于使用max内置函数)

    。index_combine(强制使用位图索引)

    。index_ffs(索引高速全然扫描)

    use_concat(将查询中全部or条件使用union all)

    。parallel

    noparallel

    。full

    ordered(基于成本)

     

    调整表连接

     

    表连接的类型

     

    等连接

    where 条件中用等式连接。

    。外部连接(左、右连接)

     

    在where条件子句的等式谓词放置一个(+)来实现,比如:

    select a.ename,b.comm from emp a,bonus b where a.ename=b.ename(+);

     

    该语句返回全部emp表的记录;

    自连接

    Select a.value total, B.value hard, (A.value - b.value) soft ,

    Round((b.value/a.value)*100,1) perc

    From v$sysstat a,v$sysstat b

    Where a.statistic# = 179

    and B.statistic# = 180;

     

    反连接

     

    反连接经常使用于not in or not exists中,是指在查询中找到的不论什么记录都不包括在结果集中的子查询;不建议使用not in or not exists;

     

    半连接

     

    查询中使用exists,含义:即使在子查询中返回多条反复的记录。外部查询也仅仅返回一条记录。

     

    嵌套循环连接

     

    。被连接表中存在索引的情况下使用;

    。使用use_nl。

     

    hash连接

     

    。Hash连接将驱动表载入在内存中。并使用hash技术连接第二个表,提高等连接速度。

    。适合于大表和小表连接;

    。使用use_hash。

     

    排序合并连接

     

    。排序合并连接不使用索引

    。使用原则:

     

    连接表子段中不存在可用索引;

     

    查询返回两个表中大部分的数据快。

     

    CBO觉得全表扫描比索引扫描运行的更快。

     

    。使用use_merge

     

    使用暂时/中间表

     

    多个大表关联时。能够分别把满足条件的结果集存放到中间表。然后用中间表关联。

     

    SQL子查询的调整

     

    关联与非关联子查询

     

    关联:子查询的内部引用的是外部表,每行运行一次;

    。非关联:子查询仅仅运行一次,存放在内存中。

     

    调整not in 和not exists语句

     

    。能够使用外部连接优化not in子句,比如:

    select ename from emp where dept_no not in

    (select dept_no from dept where dept_name =Math);

     

    改为:

    select ename from emp,dept

    where emp.dept_no=dept.dept_no

    and dept.dept_name is null;

     

    使用索引调整SQL

     

    Oracle 为什么不使用索引

     

    。检查被索引的列或组合索引的首列是否出如今PL/SQL语句的WHERE子句中,这是“运行计划”能用到相关索引的必要条件。

     

    。看採用了哪种类型的连接方式。ORACLE的共同拥有Sort Merge Join(SMJ)、Hash Join(HJ)和Nested Loop Join(NL)。在两张表连接。且内表的目标列上建有索引时。仅仅有Nested Loop才干有效地利用到该索引。SMJ即使相关列上建有索引,最多仅仅能因索引的存在。避免数据排序过程。HJ因为须做HASH运算。索引的存在对数据查询速度差点儿没有影响。

     

    看连接顺序是否同意使用相关索引。如果表emp的deptno列上有索引,表dept的列deptno上无索引,WHERE语句有emp.deptno=dept.deptno条件。在做NL连接时,emp做为外表,先被訪问。因为连接机制原因,外表的数据訪问方式是全表扫描,emp.deptno上的索引显然是用不上。最多在其上做索引全扫描或索引高速全扫描。

     

    。是否用到系统数据字典表或视图。因为系统数据字典表都未被分析过,可能导致极差的“运行计划”。可是不要擅自对数据字典表做分析,否则可能导致死锁,或系统性能下降。

     

    索引列是否函数的參数。如是,索引在查询时用不上。

     

    。是否存在潜在的数据类型转换。如将字符型数据与数值型数据比較。ORACLE会自己主动将字符型用to_number()函数进行转换,从而导致上一种现象的发生。

     

    。是否为表和相关的索引搜集足够的统计数据。对数据常常有增、删、改的表最好定期对表和索引进行分析,可用SQL语句“analyze table xxxx compute statistics for all indexes;”。ORACLE掌握了充分反映实际的统计数据,才有可能做出正确的选择。

     

    。索引列的选择性不高。   我们如果典型情况。有表emp。共同拥有一百万行数据,但当中的emp.deptno列,数据仅仅有4种不同的值,如10、20、30、40。尽管emp数据行有非常多。ORACLE缺省认定表中列的值是在全部数据行均匀分布的,也就是说每种deptno值各有25万数据行与之相应。如果SQL搜索条件DEPTNO=10,利用deptno列上的索引进行数据搜索效率,往往不比全表扫描的高。

     

    索引列值是否可为空(NULL)。

    假设索引列值能够是空值,在SQL语句中那些要返回NULL值的操作,将不会用到索引。如COUNT(*),而是用全表扫描。

    这是由于索引中存储值不能为全空。

     

    看是否实用到并行查询(PQO)。并行查询将不会用到索引。

     

    。假设从以上几个方面都查不出原因的话,我们仅仅好用採用在语句中加hint的方式强制ORACLE使用最优的“运行计划”。  hint採用凝视的方式,有行凝视和段凝视两种方式。  如我们想要用到A表的IND_COL1索引的话。可採用下面方式:  “SELECT * FROM A WHERE COL1 = XXX;"

     

    怎样屏蔽索引

     

    语句的运行计划中有不良索引时,能够人为地屏蔽该索引,方法:

     

    数值型:在索引字段上加0,比如

    select * from emp where emp_no+0 = v_emp_no;

     

    。字符型:在索引字段上加‘’。比如

    select * from tg_cdr01 where msisdn||’’=v_msisdn;

    来源:

    http://oracle.chinaitlab.com/optimize/38502.html

  • 相关阅读:
    Redis 设计与实现(第三章) -- 链表adlist
    Redis 设计与实现(第二章) -- SDS
    MySQL索引背后的数据结构及算法原理(转)
    MySQL索引原理及慢查询优化(转)
    MySQL常见的一些面试题(未完待续)
    js 获取前天、昨天、今天、明天、后天的时间
    linux 下nohup 使用
    java split 分割字符串用法
    Python 获取URL访问的HEAD头信息
    MySQL日期数据类型、时间类型使用总结
  • 原文地址:https://www.cnblogs.com/bhlsheji/p/5326416.html
Copyright © 2011-2022 走看看