zoukankan      html  css  js  c++  java
  • 表分区及索引分区

    分区概述

        为了简化数据库大表的管理,例如在数据仓库中一般都是TB级的数量级.ORACLE8以后推出了分区选项.分区将表分离在若于不同的表空间上,用分而治之的方法来支撑元限膨胀的大表,组大表在物理一级的可管理性.将大表分割成较小的分区可以改善表的维护、备份、恢复、事务及查询性能。

    分区的优点:

    1、  增强可用性:如果表的一个分区由于系统故障而不能使用,表的其余好的分区仍可以使用;

    2、  减少关闭时间:如果系统故障只影响表的一部份分区,那么只有这部份分区需要修复,矿能比整个大表修复花的时间更少;

    3、  维护轻松:如果需要得建表,独产管理每个公区比管理单个大表要轻松得多;

    4、  均衡I/O:可以把表的不同分区分配到不同的磁盘来平衡I/O改善性能;

    5、  改善性能:对大表的查询、增加、修改等操作可以分解到表的不同分区来并行执行,可使运行速度更快,在数据仓库的TP查询特别有用。

    6、  分区对用户透明,最终用户感觉不到分区的存在。

    create tablespace dw1

    datafile 'D:/oracle/oradata/ora9/dw11.ora' size 50M

    create tablespace dw2

    datafile 'D:/oracle/oradata/ora9/dw21.ora' size 50M

    一、按范围分区:固名思义就是按一定range来分区,看下面的例子:

    SQL> set linesize 1000

    SQL> create table niegc_part

      2  (

      3  part_id integer primary key,

      4  part_date date,

      5  part_dec varchar2(100)

      6  )

      7  partition by range(part_date)

      8  (

      9  partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dw1,

     10  partition part_02 values less than(to_date('2007-01-01','yyyy-mm-dd')) tablespace dw2,

     11  partition part_03 values less than(maxvalue) tablespace dw1

     12  );

     

    表已创建。

     

    SQL>

    SQL> insert into niegc_part values(1,to_date('2005-12-30','yyyy-mm-dd'),'less 20

    06-01-01');

     

    已创建 1 行。

     

    SQL> commit;

     

    提交完成。

     

    SQL> insert into niegc_part values(2,to_date('2006-01-01','yyyy-mm-dd'),'equal 2

    007-01-01');

     

    已创建 1 行。

     

    SQL> commit;

     

    提交完成。

     

    SQL> insert into niegc_part values(3,sysdate,'sysdate');

     

    已创建 1 行。

     

    SQL> commit;

     

    提交完成。

     

    SQL>

    SQL>

    SQL> select * from niegc_part partition(part_01);

     

       PART_ID PART_DATE  PART_DEC

    ---------- ---------- ----------------------------------------------------------

    ------------------------------------------

             1 30-12月-05 less 2006-01-01

     

    SQL>

    相信只要对oracle 有点熟,都能知道上面的range分区的意思了.

    两个字段以上的range分区大同小异,请看下面的例子:

    create table niegc_part
    (
    part_id integer primary key,
    part_date date,
    part_dec varchar2(100)
    )
    partition by range(part_id,part_date)
    (
    partition part_01 values less than(1,to_date('2006-01-01','yyyy-mm-dd')) tablespace dw,
    partition part_02 values less than(10,to_date('2007-01-01','yyyy-mm-dd')) tablespace dw,
    partition part_03 values less than(maxvalue,maxvalue) tablespace dw
    );
     

    二、Hash分区(散列分区)。 散列分区通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使行这些分区大小一致。如将part_id的数据根据自身的情况散列地存放在指定的三个表空间中:

    create table niegc_part

    (

    part_id integer primary key,

    part_date date,

    part_dec varchar2(100)

    )

    partition by hash(part_id)

    (

    partition part_01  tablespace dw1,

    partition part_02  tablespace dw2

    );

    系统将按part_id将记录散列地插入三个分区中,这里也就是二个不同的表空间中。

    三、复合分区。根据范围分区后,每个分区内的数据再散列地分布在几个表空间中,这样我们就要使用复合分区。复合分区是先使用范围分区,然后在每个分区同再使用散列分区的一种分区方法,如将part_date的记录按时间分区,然后每个分区中的数据分三个子分区,将数据散列地存储在三个指定的表空间中:

    create table niegc_part

    (

    part_id integer primary key,

    part_date date,

    part_dec varchar2(100)

    )

    partition by range(part_date) subpartition by hash(part_id)

    subpartitions 2 store in(dw1,dw2)

    (

    partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dw1,

    partition part_02 values less than(to_date('2007-01-01','yyyy-mm-dd')) tablespace dw2,

    partition part_03 values less than(maxvalue) tablespace dw1

    );

    先根据part_date进行范围分区,然后根据交易的ID将记录散列地存储在二个表空间中。

    四、索引分区:

    注意: 对某个字段已做了分区了,是不允许再建立索引分区的。这一点要非常注意。

    全局索引建立时global子句允许指定索引的范围值,这个范围值为索引字段的范围值:

    create index idx_part_id on niegc_part(part_dec)

    global partition by range(part_dec)

    (

    partition idx_1 values less than('1000') tablespace dw,

    partition idx_2 values less than(maxvalue) tablespace dw

    )

    局部索引分区的建立:(注意:表必须存在分区,此分区的个数必须和分区表的分区个数一样,不然是建立不起来的)

    create index idx_part_id on niegc_part(part_dec)

    local

    (

    partition idx_1 tablespace dw1,

    partition idx_2 tablespace dw2

    )

    五、分区维护:(只对范围分区)

    (1)、增加一个分区:分区范围只能往上增,不能增加一个少于原有的分区:

    alter table niegc_part add partition part_03 values less than(maxvalue)

    (2)、合并分区:(合并后的分区必须指下最后一个大value的分区)

    alter table niegc_part merge partitions part_02,part_03 into  partition part_03

    (3)、删除一个分区:

    alter table niegc_part drop partition part_01

    六、总结:

    需要说明的是,本文在举例说名分区表事务操作的时候,都指定了分区,因为指定了分区,系统在执行的时候则只操作该分区的记录,提高了数据处理的速度。不要指定分区直接操作数据也是可以的。在分区表上建索引及多索引的使用和非分区表一样。此外,因为在维护分区的时候可能对分区的索引会产生一定的影响,可能需要在维护之后重建索引,相关内容请google分区表索引部分的文档

  • 相关阅读:
    Linux IO模型漫谈(3) 阻塞式IO实现
    Linux IO模型漫谈(4) 非阻塞IO
    Linux IO模型漫谈(6) 信号驱动IO模型
    Go语言_反射篇
    Linux IO模型漫谈(5) IO复用模型之select
    Go语言_函数学习篇
    Go语言_接口篇
    nginx源码学习Unix Unix域协议
    Java GC
    Heritrix 3.1.0 源码解析(三十四)
  • 原文地址:https://www.cnblogs.com/shaohz2014/p/3708171.html
Copyright © 2011-2022 走看看