zoukankan      html  css  js  c++  java
  • 索引学习(一)

    在海量信息发展的今天,如何快速的查找和定位到我们需要的数据成为一种挑战,而数据库索引也是这一挑战中最为基础的元素。

    索引就是加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中,索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息。在数据库中,索引也允许数据库程序迅速地找到表中的数据,而不必扫描整个数据库。

    1.  索引的类型

      B-树索引   
      位图索引  
      HASH索引    
      索引编排表
      反转键索引
      基于函数的索引 
      分区索引  
      本地和全局索引

    2. 索引优点:
    2.1  通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。

    2.2  可以大大提高数据的检索速度,这也是创建索引的最主要的原因。

    2.3  可以提高表和表之间的连接速度,特别是在实现数据的参考完整性方面特别有意义。

    2.4  在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。

    2.5  通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。

    3. 索引的缺点:
    3.1  创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。

    3.2  索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。

    3.3  当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。


    4. 应该建索引列的特点:

    4.1  在经常需要搜索的列上,可以加快搜索的速度;

    4.2  在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;

    4.3  在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;

    4.4  在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;

    4.5  在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;

    4.6  在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。

    5. 不宜建立索引的特性:
     
    5.1  对于那些在查询中很少使用或者参考的列不应该创建索引。
            这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。
            相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。

    5.2  对于那些只有很少数据值的列也不应该增加索引。
           这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,
           即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。

    5.3  对于那些定义为blob数据类型的列不应该增加索引。
            这是因为,这些列的数据量要么相当大,要么取值很少。

    5.3  当修改性能远远大于检索性能时,不应该创建索引。
           这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。
           当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。

    5.4  含有Null值的列,不应该建立索引。
        


        
        
    6. 限制索引(索引失效)的因素有:
    6.1  使用不等于操作符(<>、!=)
             下面的查询即使在cust_rating列有一个索引,查询语句仍然执行一次全表扫描。
             select cust_Id,cust_name from customers where  cust_rating <> 'aa';       

           把上面的语句改成如下的查询语句,这样,在采用基于规则的优化器而不是基于代价的优化器(更智能)时,将会使用索引。       
           select cust_Id,cust_name from customers where cust_rating < 'aa' or cust_rating > 'aa';

       特别注意:通过把不等于操作符改成OR条件,就可以使用索引,以避免全表扫描。
     
    6.2   使用IS NULL 或IS NOT NULL
            使用IS NULL 或IS NOT NULL同样会限制索引的使用,因为NULL值并没有被定义。
            在SQL语句中使用NULL会有很多的麻烦。因此建议开发人员在建表时,把需要索引的列设成NOT NULL。
            如果被索引的列在某些行中存在NULL值,就不会使用这个索引(除非索引是一个位图索引,关于位图索引在稍后在详细讨论)。
        
    6.3   使用函数
              如果不使用基于函数的索引,那么在SQL语句的WHERE子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。
              下面的查询不会使用索引(只要它不是基于函数的索引)
            
            select empno,ename,deptno from emp  where  trunc(hiredate)='01-MAY-81';

            把上面的语句改成下面的语句,这样就可以通过索引进行查找。
            select empno,ename,deptno from emp where  hiredate<(to_date('01-MAY-81')+0.9999);
        
    6.4   比较不匹配的数据类型
             也是比较难于发现的性能问题之一, 注意下面查询的例子,account_number是一个VARCHAR2类型,在account_number字段上有索引。

            下面的语句将执行全表扫描:
            select bank_name,address,city,state,zip from banks where account_number = 990354;
            Oracle可以自动把where子句变成to_number(account_number)=990354,这样就限制了索引的使用,改成下面的查询就可以使用索引:
            select bank_name,address,city,state,zip from banks where account_number ='990354';
     
            特别注意:不匹配的数据类型之间比较会让Oracle自动限制索引的使用, 即便对这个查询执行Explain Plan也不能让您明白为什么做了一次“全表扫描”
            
    6.5   对索引列进行运算
             使用函数,类型不匹配,对索引列进行各类运算,都会导致索引失效。
            
    6.6   当使用LIKE关键字时,LIKE ‘%——’ 百分号在前面的,索引也会失效
    6.7      单独的  >,  <   >=,  <=  如果查询数据超出30%,  索引也会失效.


    7.  选用适合的Oracle优化器

        1.  Oracle的优化器共有3种:
            a. RULE (基于规则)
            b. COST (基于成本)
            c. CHOOSE (选择性)。    
            
            
            
            
    本文参考以下内容: http://www.2cto.com/database/201110/107271.html       

  • 相关阅读:
    拥抱函数式编程 I
    关于CMS的那点事 I
    常用正规表达式
    javascript source map 的使用
    架构师修炼 后记
    CSS 天坑 I
    架构师修炼 III
    架构师修炼 II
    win10,VM14 安装cnetos6.9 虚拟机黑屏和只有光标闪烁解决办法
    C/C++数组初始化
  • 原文地址:https://www.cnblogs.com/dragonflyyi/p/3716078.html
Copyright © 2011-2022 走看看