在海量信息发展的今天,如何快速的查找和定位到我们需要的数据成为一种挑战,而数据库索引也是这一挑战中最为基础的元素。
索引就是加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中,索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息。在数据库中,索引也允许数据库程序迅速地找到表中的数据,而不必扫描整个数据库。
1. 索引的类型
B-树索引
位图索引
HASH索引
索引编排表
反转键索引
基于函数的索引
分区索引
本地和全局索引
2. 索引优点:
2.1 通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。
2.2 可以大大提高数据的检索速度,这也是创建索引的最主要的原因。
2.3 可以提高表和表之间的连接速度,特别是在实现数据的参考完整性方面特别有意义。
2.4 在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。
2.5 通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。
3. 索引的缺点:
3.1 创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。
3.2 索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。
3.3 当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。
4. 应该建索引列的特点:
4.1 在经常需要搜索的列上,可以加快搜索的速度;
4.2 在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;
4.3 在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;
4.4 在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;
4.5 在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;
4.6 在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。
5. 不宜建立索引的特性:
5.1 对于那些在查询中很少使用或者参考的列不应该创建索引。
这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。
相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。
5.2 对于那些只有很少数据值的列也不应该增加索引。
这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,
即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。
5.3 对于那些定义为blob数据类型的列不应该增加索引。
这是因为,这些列的数据量要么相当大,要么取值很少。
5.3 当修改性能远远大于检索性能时,不应该创建索引。
这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。
当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。
5.4 含有Null值的列,不应该建立索引。
6. 限制索引(索引失效)的因素有:
6.1 使用不等于操作符(<>、!=)
下面的查询即使在cust_rating列有一个索引,查询语句仍然执行一次全表扫描。
select cust_Id,cust_name from customers where cust_rating <> 'aa';
把上面的语句改成如下的查询语句,这样,在采用基于规则的优化器而不是基于代价的优化器(更智能)时,将会使用索引。
select cust_Id,cust_name from customers where cust_rating < 'aa' or cust_rating > 'aa';
特别注意:通过把不等于操作符改成OR条件,就可以使用索引,以避免全表扫描。
6.2 使用IS NULL 或IS NOT NULL
使用IS NULL 或IS NOT NULL同样会限制索引的使用,因为NULL值并没有被定义。
在SQL语句中使用NULL会有很多的麻烦。因此建议开发人员在建表时,把需要索引的列设成NOT NULL。
如果被索引的列在某些行中存在NULL值,就不会使用这个索引(除非索引是一个位图索引,关于位图索引在稍后在详细讨论)。
6.3 使用函数
如果不使用基于函数的索引,那么在SQL语句的WHERE子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。
下面的查询不会使用索引(只要它不是基于函数的索引)
select empno,ename,deptno from emp where trunc(hiredate)='01-MAY-81';
把上面的语句改成下面的语句,这样就可以通过索引进行查找。
select empno,ename,deptno from emp where hiredate<(to_date('01-MAY-81')+0.9999);
6.4 比较不匹配的数据类型
也是比较难于发现的性能问题之一, 注意下面查询的例子,account_number是一个VARCHAR2类型,在account_number字段上有索引。
下面的语句将执行全表扫描:
select bank_name,address,city,state,zip from banks where account_number = 990354;
Oracle可以自动把where子句变成to_number(account_number)=990354,这样就限制了索引的使用,改成下面的查询就可以使用索引:
select bank_name,address,city,state,zip from banks where account_number ='990354';
特别注意:不匹配的数据类型之间比较会让Oracle自动限制索引的使用, 即便对这个查询执行Explain Plan也不能让您明白为什么做了一次“全表扫描”
6.5 对索引列进行运算
使用函数,类型不匹配,对索引列进行各类运算,都会导致索引失效。
6.6 当使用LIKE关键字时,LIKE ‘%——’ 百分号在前面的,索引也会失效
6.7 单独的 >, < >=, <= 如果查询数据超出30%, 索引也会失效.
7. 选用适合的Oracle优化器
1. Oracle的优化器共有3种:
a. RULE (基于规则)
b. COST (基于成本)
c. CHOOSE (选择性)。
本文参考以下内容: http://www.2cto.com/database/201110/107271.html