zoukankan      html  css  js  c++  java
  • 索引学习(一)

    在海量信息发展的今天,如何快速的查找和定位到我们需要的数据成为一种挑战,而数据库索引也是这一挑战中最为基础的元素。

    索引就是加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中,索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息。在数据库中,索引也允许数据库程序迅速地找到表中的数据,而不必扫描整个数据库。

    1.  索引的类型

      B-树索引   
      位图索引  
      HASH索引    
      索引编排表
      反转键索引
      基于函数的索引 
      分区索引  
      本地和全局索引

    2. 索引优点:
    2.1  通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。

    2.2  可以大大提高数据的检索速度,这也是创建索引的最主要的原因。

    2.3  可以提高表和表之间的连接速度,特别是在实现数据的参考完整性方面特别有意义。

    2.4  在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。

    2.5  通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。

    3. 索引的缺点:
    3.1  创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。

    3.2  索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。

    3.3  当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。


    4. 应该建索引列的特点:

    4.1  在经常需要搜索的列上,可以加快搜索的速度;

    4.2  在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;

    4.3  在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;

    4.4  在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;

    4.5  在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;

    4.6  在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。

    5. 不宜建立索引的特性:
     
    5.1  对于那些在查询中很少使用或者参考的列不应该创建索引。
            这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。
            相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。

    5.2  对于那些只有很少数据值的列也不应该增加索引。
           这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,
           即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。

    5.3  对于那些定义为blob数据类型的列不应该增加索引。
            这是因为,这些列的数据量要么相当大,要么取值很少。

    5.3  当修改性能远远大于检索性能时,不应该创建索引。
           这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。
           当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。

    5.4  含有Null值的列,不应该建立索引。
        


        
        
    6. 限制索引(索引失效)的因素有:
    6.1  使用不等于操作符(<>、!=)
             下面的查询即使在cust_rating列有一个索引,查询语句仍然执行一次全表扫描。
             select cust_Id,cust_name from customers where  cust_rating <> 'aa';       

           把上面的语句改成如下的查询语句,这样,在采用基于规则的优化器而不是基于代价的优化器(更智能)时,将会使用索引。       
           select cust_Id,cust_name from customers where cust_rating < 'aa' or cust_rating > 'aa';

       特别注意:通过把不等于操作符改成OR条件,就可以使用索引,以避免全表扫描。
     
    6.2   使用IS NULL 或IS NOT NULL
            使用IS NULL 或IS NOT NULL同样会限制索引的使用,因为NULL值并没有被定义。
            在SQL语句中使用NULL会有很多的麻烦。因此建议开发人员在建表时,把需要索引的列设成NOT NULL。
            如果被索引的列在某些行中存在NULL值,就不会使用这个索引(除非索引是一个位图索引,关于位图索引在稍后在详细讨论)。
        
    6.3   使用函数
              如果不使用基于函数的索引,那么在SQL语句的WHERE子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。
              下面的查询不会使用索引(只要它不是基于函数的索引)
            
            select empno,ename,deptno from emp  where  trunc(hiredate)='01-MAY-81';

            把上面的语句改成下面的语句,这样就可以通过索引进行查找。
            select empno,ename,deptno from emp where  hiredate<(to_date('01-MAY-81')+0.9999);
        
    6.4   比较不匹配的数据类型
             也是比较难于发现的性能问题之一, 注意下面查询的例子,account_number是一个VARCHAR2类型,在account_number字段上有索引。

            下面的语句将执行全表扫描:
            select bank_name,address,city,state,zip from banks where account_number = 990354;
            Oracle可以自动把where子句变成to_number(account_number)=990354,这样就限制了索引的使用,改成下面的查询就可以使用索引:
            select bank_name,address,city,state,zip from banks where account_number ='990354';
     
            特别注意:不匹配的数据类型之间比较会让Oracle自动限制索引的使用, 即便对这个查询执行Explain Plan也不能让您明白为什么做了一次“全表扫描”
            
    6.5   对索引列进行运算
             使用函数,类型不匹配,对索引列进行各类运算,都会导致索引失效。
            
    6.6   当使用LIKE关键字时,LIKE ‘%——’ 百分号在前面的,索引也会失效
    6.7      单独的  >,  <   >=,  <=  如果查询数据超出30%,  索引也会失效.


    7.  选用适合的Oracle优化器

        1.  Oracle的优化器共有3种:
            a. RULE (基于规则)
            b. COST (基于成本)
            c. CHOOSE (选择性)。    
            
            
            
            
    本文参考以下内容: http://www.2cto.com/database/201110/107271.html       

  • 相关阅读:
    第36课 经典问题解析三
    第35课 函数对象分析
    67. Add Binary
    66. Plus One
    58. Length of Last Word
    53. Maximum Subarray
    38. Count and Say
    35. Search Insert Position
    28. Implement strStr()
    27. Remove Element
  • 原文地址:https://www.cnblogs.com/dragonflyyi/p/3716078.html
Copyright © 2011-2022 走看看