随着表中行数的增多,管理和性能性能影响也将随之增加。备份将要花费更多时间,恢复也将 要花费更说的时间,对整个数据表的查询也将花费更多时间。通过把一个表中的行分为几个部分,可以减少大型表的管理和性能问题,以这种方式划分发表数据的方法称为对表的分区。分区表的优势:
(1)改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度;
(2)方便数据管理:因为分区表的数据存储在多个部分中,所以按分区加载和删除数据比在大表中加载和删除数据更容易;
(3)方便备份恢复:因为分区比被分区的表要小,所以针对分区的备份和恢复方法要比备份和恢复整个表的方法多。
1)范围分区
2)列表分区
3)散列分区(hash分区)
4)复合分区(子分区)
1,创建4个测试用的表空间,每个表空间作为一个独立分区(考虑到Oracle中分区映射的实现方式,建议将表中的分区数设置为2的乘方,以便使数据均匀分布)
SYS>create tablespace partition1 datafile '/home/oracle/app/oradata/orcl/partition1.dbf' size 20m;
SYS>create tablespace partition2 datafile '/home/oracle/app/oradata/orcl/partition2.dbf' size 20m;
SYS>create tablespace partition3 datafile '/home/oracle/app/oradata/orcl/partition3.dbf' size 20m;
SYS>create tablespace partition4 datafile '/home/oracle/app/oradata/orcl/partition4.dbf' size 20m;
范围分区就是对数据表中的某个值的范围进行分区,根据某个值的范围,决定将该数据存储在哪个分区上。如根据序号分区,根据业务记录的创建日期进行分区等(联通每个月的账单记录就用的分区表存储)。
需求描述:有一个物料交易表,表名:material_transactions。该表将来可能有千万级的数据记录数。要求在建该表的时候使用分区表。这时候我们可以使用序号分区三个区,每个区中预计存储三千万的数据,也可以使用日期分区,如每五年的数据存储在一个分区上。
根据交易记录的序号分区建表:----为了测试需要做以下修改:
交易号小于2的记录存储在分区1上,大于等于2且小于4的交易号储存在分区2上,大于等于4且小于6的交易号储存在分区3上,大于等于6的交易号存储在分区4上。(不必为最后一个分区指定最大值,maxvalue关键字会告诉Oracle使用这个分区来存储在前面几个分区中不能储存的数据)。
2.1,向分区表里面插入数据:
2.2,查询表数据
不指定分区:
指定分区:
2.3,更改表数据
2.4,删除表数据
3,散列分区(hash分区)
除范围分区外,Oracle还支持散列分区。散列分区通过在分区键值上执行一个散列函数来说决定数据的物理位置。在范围分区中,分区键的连续值通常储存在相同的分区中。而在散列分区中,连续的分区键值不必储存在相同的分区中。散列分区把记录分布在比范围分区更多的分区上,这减少了I/O争用的可能性。
还有一种定义hash分区的方式是:partition by hash(column) partition n store in (tbs1,,,tbsm)。表空间的数目不必等于分区的数目,即n不一定等于m,如果指定的分区数目比表空间的数目多,则分区将会以循环的方式分配到表空间中,一个表空间可以含有多个分区:
4,列表分区
列表分区告诉Oracle所有可能的值,并指定应该插入相应行的分区,它适用于表的数据量很大但是某一列的值只有少量几种。
在列表分区中,可以使用关键字default来指定未列出的所有情况。(上述4个分区创建在一个表空间中)
5,复合分区(子分区)
有时候我们需要根据范围分区后,每个分区内的数据再散列地分布在几个表空间中,这样我们就要使用复合分区。复合分区是先使用范围分区,然后在每个分区内再使用散列分区/列表分区的一种分区方法。如将物料交易的记录按时间分区,然后每个分区中的数据分三个子分区,将数据散列地存储在三个指定的表空间中:
p1:sales_cost小于1
p1sub1:sales_cost小于1,且status为ACTIVE
p1sub2:sales_cost小于1,且status为INACTIVE
p2:sales_cost大于等于1,小于3
p2sub1:sales_cost大于等于1,小于3,且status为ACTIVE
p2sub2:sales_cost大于等于1,小于3,且status为INACTIVE
操作测试:
补充:如果插入的值不在自定义的所有分区范围内,将由Oracle来分配。
1、添加分区
以下代码给SALES表添加了一个P3分区:
ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));
注意:以上添加的分区界限应该高于最后一个分区界限。
以下代码给SALES表的P3分区添加了一个P3SUB1子分区
ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');
2、删除分区
以下代码删除了P3表分区:
ALTER TABLE SALES DROP PARTITION P3;
在测试中遇到这样的情况。如果表创建了分区,如果要删除数据文件(表空间文件),则要先删除分区,然后才能删除数据文件(但是在删除数据文件时,必须要保留一个分区才能最终删除数据文件&表空间文件)。当然,也可以直接就删除表也行,刚所有的全删除,但是表空间文件还在。
在以下代码删除了P4SUB1子分区:
ALTER TABLE SALES DROP SUBPARTITION P4SUB1;
注意:如果删除的分区是表中唯一的分区,那么此分区将不能被删除,要想删除此分区,必须先删除表。
3、截断分区
截断某个分区是指删除某个分区中的数据,并不会删除分区,也不会删除其它分区中的数据。当表中即使只有一个分区时,也可以截断该分区。通过以下代码截断分区:
ALTER TABLE SALES TRUNCATE PARTITION P2;
通过以下代码截断子分区:
ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;
4、合并分区
合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并:
ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;
5、拆分分区
拆分分区将一个分区拆分两个新分区,拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。
ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22);
6、接合分区(coalesca)
结合分区是将散列分区中的数据接合到其它分区中,当散列分区中的数据比较大时,可以增加散列分区,然后进行接合,值得注意的是,接合分区只能用于散列分区中。通过以下代码进行接合分区:
ALTER TABLE SALES COALESCA PARTITION;
7、重命名表分区
以下代码将P21更改为P2
ALTER TABLE SALES RENAME PARTITION P21 TO P2;
8、跨分区查询
select sum( *) from (
select count(*) cn from t_table_SS PARTITION (P200709_1)
union all
select count(*) cn from t_table_SS PARTITION (P200709_2)
);
9、与分区相关的表和视图:
分区 |
--查询表上有多少分区:SELECT * FROM USER_TAB_PARTITIONS WHERE TABLE_NAME='tableName'
--显示表分区信息 显示数据库所有分区表的详细分区信息:select * from DBA_TAB_PARTITIONS
--显示当前用户可访问的所有分区表的详细分区信息:select * from ALL_TAB_PARTITIONS
--显示当前用户所有分区表的详细分区信息:select * from USER_TAB_PARTITIONS
|
子分区 |
--显示子分区信息 显示数据库所有组合分区表的子分区信息:select * from DBA_TAB_SUBPARTITIONS
--显示当前用户可访问的所有组合分区表的子分区信息:select * from ALL_TAB_SUBPARTITIONS
--显示当前用户所有组合分区表的子分区信息:select * from USER_TAB_SUBPARTITIONS
|
分区表 |
--显示数据库所有分区表的信息:select * from DBA_PART_TABLES where table_name=upper('dinya_test')
--显示当前用户可访问的所有分区表信息:select * from ALL_PART_TABLES
--显示当前用户所有分区表的信息:select * from USER_PART_TABLES
|
分区列 |
--显示分区列 显示数据库所有分区表的分区列信息:select * from DBA_PART_KEY_COLUMNS
--显示当前用户可访问的所有分区表的分区列信息:select * from ALL_PART_KEY_COLUMNS
--显示当前用户所有分区表的分区列信息:select * from USER_PART_KEY_COLUMNS
|
子分区列 |
--显示子分区列 显示数据库所有分区表的子分区列信息:select * from DBA_SUBPART_KEY_COLUMNS
--显示当前用户可访问的所有分区表的子分区列信息:select * from ALL_SUBPART_KEY_COLUMNS
--显示当前用户所有分区表的子分区列信息:select * from USER_SUBPART_KEY_COLUMNS
|
特例 |
--怎样查询出oracle数据库中所有的的分区表:select * from user_tables a where a.partitioned='YES' |
--删除一个表的数据是
truncate table table_name;
--删除分区表一个分区的数据是
alter table table_name truncate partition p5;
注:分区根据具体情况选择。
表分区有以下优点:
1、数据查询:数据被存储到多个文件上,减少了I/O负载,查询速度提高。
2、数据修剪:保存历史数据非常的理想。
3、备份:将大表的数据分成多个文件,方便备份和恢复。
4、并行性:可以同时向表中进行DML操作,并行性性能提高。
================================================
四、分区索引:
1、一般索引:create index index_name on table(col_name);
2、Oracle 分区索引详解
语法:Table Index
CREATE [UNIQUE|BITMAP] INDEX [schema.]index_name
ON [schema.]table_name [tbl_alias]
(col [ASC | DESC]) index_clause index_attribs
index_clauses:
分以下两种情况
1. Local Index
就是索引信息的存放位置依赖于父表的Partition信息,换句话说创建这样的索引必须保证父表是Partition
1.1 索引信息存放在父表的分区所在的表空间。但是仅可以创建在父表为HashTable或者composite分区表的。
LOCAL STORE IN (tablespace)
1.2 仅可以创建在父表为HashTable或者composite分区表的。并且指定的分区数目要与父表的分区数目要一致
LOCAL STORE IN (tablespace) (PARTITION [partition [LOGGING|NOLOGGING] [TABLESPACE {tablespace|DEFAULT}] [PCTFREE int] [PCTUSED int] [INITRANS int] [MAXTRANS int] [STORAGE storage_clause] [STORE IN {tablespace_name|DEFAULT] [SUBPARTITION [subpartition [TABLESPACE tablespace]]]])
1.3 索引信息存放在父表的分区所在的表空间,这种语法最简单,也是最常用的分区索引创建方式。
Local
1.4 并且指定的Partition 数目要与父表的Partition要一致
LOCAL (PARTITION [partition
[LOGGING|NOLOGGING]
[TABLESPACE {tablespace|DEFAULT}]
[PCTFREE int]
[PCTUSED int]
[INITRANS int]
[MAXTRANS int]
[STORAGE storage_clause]
[STORE IN {tablespace_name|DEFAULT]
[SUBPARTITION [subpartition [TABLESPACE tablespace]]]])
Global Index
索引信息的存放位置与父表的Partition信息完全不相干。甚至父表是不是分区表都无所谓的。语法如下:
GLOBAL PARTITION BY RANGE (col_list)
( PARTITION partition VALUES LESS THAN (value_list)
[LOGGING|NOLOGGING]
[TABLESPACE {tablespace|DEFAULT}]
[PCTFREE int]
[PCTUSED int]
[INITRANS int]
[MAXTRANS int]
[STORAGE storage_clause] )
但是在这种情况下,如果父表是分区表,要删除父表的一个分区都必须要更新Global Index ,否则索引信息不正确
ALTER TABLE TableName DROP PARTITION PartitionName Update Global Indexes
--查询索引
select object_name,object_type,tablespace_name,sum(value)
from v$segment_statistics
where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX'
group by object_name,object_type,tablespace_name
order by 4 desc
注意:不能为散列分区或子分区创建全局索引。