Oracle索引的原理及使用
一、前引
- 索引在数据库中扮演着非常重要的角色,是数据库对象之一,用于加快数据的检索,类似于书籍的目录。在数据库中索引可以减少数据库程序查询结果时需要读取的数据量,类似于在书籍中我们利用索引可以不用翻阅整本书即可找到想要的信息。
- 索引是建立在表上的可选对象,索引的关键在于通过一组排序后的索引键来取代默认的全表扫描检索方式,从而提高检索效率。
- 索引在逻辑上和物理上都与相关的表和数据无关,当创建或者删除一个索引时,不会影响基本的表。
- 索引一旦建立,在表上进行DML操作时(例如在执行插入、修改或者删除相关操作时),oracle会自动管理索引,索引删除,不会对表产生影响。
- 索引对用户是透明的,无论表上是否有索引,sql语句的用法不变。
- oracle创建主键时会自动在该列上创建索引。
二、索引原理
- 若没有索引,搜索某个记录时(例如查找name='张三')需要搜索所有的记录,因为不能保证只有一个张三,必须全部搜索一遍。
- 若在name上建立索引,oracle会对全表进行一次搜索,将每条记录的name值哪找升序排列(建立索引时做的),然后构建索引条目(name和rowid),存储到索引段中,查询name为张三时即可直接查找对应地方。
- 创建了索引并不一定就会使用,oracle自动统计表的信息后,决定是否使用索引,表中数据很少时使用全表扫描速度已经很快,没有必要使用索引。
- 占用存储空间:索引实际上也是一张表,记录了主键与索引字段,一般以索引文件的形式存储在磁盘上。
- 降低更新表的速度:表的数据发生了变化,对应的索引也需要一起变更,从而减低的更新速度。否则索引指向的物理数据可能不对,这也是索引失效的原因之一。
- 特大型的表,建立和使用索引的代价随着增长,可以使用分区技术来解决。
三、使用
- 语法
CREATE [UNIQUE] | [BITMAP] INDEX index_name --unique表示唯一索引
ON table_name([column1 [ASC|DESC],column2 --bitmap,创建位图索引
[ASC|DESC],…] | [express]) [TABLESPACE tablespace_name]
[PCTFREE n1] --指定索引在数据块中空闲空间
[STORAGE (INITIAL n2)]
[NOLOGGING] --表示创建和重建索引时允许对表做DML操作,默认情况下不应该使用
[NOLINE]
[NOSORT]; --表示创建索引时不进行排序,默认不适用,如果数据已经是按照该索引顺序排列的可以使用
例子:
--给列 localid 添加索引(索引名称一般就是表名加个index_列名)
create Index index_localid_STATATIC_YEAR on STATATIC_YEAR(localid);
- 修改索引
alter index index_localid_STATATIC_YEAR rename to bitmap_index;
- 合并索引( 表使用一段时间后在索引中会产生碎片,此时索引效率会降低,可以选择重建索引或者合并索引,合并索引方式更好些,无需额外存储空间,代价较低)
alter index index_localid_STATATIC_YEAR coalesce;
- 重建索引
-
方式一:删除原来的索引,重新建立索引
-
方式二:
alter index index_localid_STATATIC_YEAR rebuild;
- 删除索引
drop index index_localid_STATATIC_YEAR;
- 查看索引
---查询索引
select * from user_indexes where table_name='PEOPLE'
select index_name,index-type, tablespace_name, uniqueness from all_indexes where table_name ='tablename';
-- 创建例子
create index index_sno on student('name');
select * from all_indexes where table_name='student';
四、索引分类
B树索引(默认索引)
- 创建
craete index index_sno on student('sno');
-
说明
- oracle中最常用的索引;
- B树索引就是一颗二叉树;
- 叶子节点(双向链表)包含索引列和指向表中每个匹配行的ROWID值;
- 所有叶子节点具有相同的深度,因而不管查询条件怎样,查询速度基本相同;
- 能够适应精确查询、模糊查询和比较查询;
-
使用场景
列基数(列不重复值的个数)大时适合使用B数索引
位图索引
- 创建
create bitmap index index_sno on student(sno);
-
说明
- 创建位图索引时,oracle会扫描整张表,并为索引列的每个取值建立一个位图(位图中,对表中每一行使用一位(bit,0或者1)来标识该行是否包含该位图的索引列的取值,如果为1,表示对应的rowid所在的记录包含该位图索引列值),最后通过位图索引中的映射函数完成位到行的ROWID的转换。
-
使用场景
对于基数小的列适合简历位图索引(例如性别等)
复合索引(基于多个列创建)
- 创建
craete index index_sno on student('sno','sex');
- 说明
- 创建符合索引时,注意多个列的前后顺序,会影响查询的效率。
- 选择经常在WHERE中使用,并且是由AND进行连接的列做符合索引列。
- 选择WHERE中使用频率相对较高的列排在前面,或者根据需要为其他列创建单独的索引。
- 只有复合索引中的第一列被WHERE子句使用时,Oracle才会使用该复合索引。
函数索引
- 创建
create index fbi on student (upper(name));
select * from student where upper(name) ='WISH';
- 说明
- 当经常要访问一些函数或者表达式时,可以将其存储在索引中,这样下次访问时,该值已经计算出来了,可以加快查询速度。
- 函数索引中可以使用len、trim、substr、upper(每行返回独立结果),不能使用如sum、max、min、avg等。
-- 常用函数
-- lower:大写字符转化成百小写的函数
select lower(表中字段) from 表名 --将表里的字问段信息中含有字母答的全部转回成小写
-- upper:小写字答符转化成大写的函数
select upper(表中字段) from 表名 --将 user表里的字段信息中含有字母的全部转成大写
-- substr:切割字符串
create index t_object_type_idn_fun on t(substr(object_type,1,3));
select * from t where substr(t.object_type,1,3)='XXX';
五、索引建立原则
- 如果有两个或者以上的索引,其中有一个唯一性索引,而其他是非唯一,这种情况下oracle将使用唯一性索引而完全忽略非唯一性索引
- 至少要包含组合索引的第一列(即如果索引建立在多个列上,只有它的第一个列被where子句引用时,优化器才会使用该索引)
- 小表不要简历索引
- 对于基数大的列适合建立B树索引,对于基数小的列适合简历位图索引
- 列中有很多空值,但经常查询该列上非空记录时应该建立索引
- 经常进行连接查询的列应该创建索引
- 使用create index时要将最常查询的列放在最前面
- LONG(可变长字符串数据,最长2G)和LONG RAW(可变长二进制数据,最长2G)列不能创建索引。
- 限制表中索引的数量(创建索引耗费时间,并且随数据量的增大而增大;索引会占用物理空间;当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,降低了数据的维护速度)。
六、举个栗子
- 通配符在搜索词首出现时,oracle不能使用索引
--在name上创建索引;
create index index_name on student('name');
--下面的方式oracle不适用name索引
select * from student where name like '%wish%';
--如果通配符出现在字符串的其他位置时,优化器能够利用索引
select * from student where name like 'wish%';
- 不要在索引列上使用not,可以采用其他方式代替如下:(oracle碰到not会停止使用索引,而采用全表扫描)
select * from student where not (score=100);
select * from student where score <> 100;
--替换为
select * from student where score>100 or score <100
- 索引上使用空值比较将停止使用索引
select * from student where score is not null;