zoukankan      html  css  js  c++  java
  • oracle 分区表

    分区表理论知识

    Oracle提供了分区技术以支持VLDB(Very Large DataBase)。分区表通过对分区列的判断,把分区列不同的记录,放到不同的分区中。分区完全对应用透明。

    Oracle的分区表可以包括多个分区,每个分区都是一个独立的段(SEGMENT),可以存放到不同的表空间中。查询时可以通过查询表来访问各个分区中的数据,也可以通过在查询时直接指定分区的方法来进行查询。

    When to Partition a Table什么时候需要分区表,官网的2个建议如下:

    (1)Tables greater than 2GB should always be considered for partitioning.

    (2)Tables containing historical data, in which new data is added into the newest partition. A typical example is a historical table where only the current month's data is updatable and the other 11 months are read only.

    oracle 10g中最多支持:1024k-1个分区:

    Tables can be partitioned into up to 1024K-1 separate partitions

    联机文档上有关分区表和索引的说明:

    Partitioned Tables and Indexes

    http://download.oracle.com/docs/cd/B19306_01/server.102/b14220/partconc.htm#sthref2604

    分区提供以下优点:

    (1)由于将数据分散到各个分区中,减少了数据损坏的可能性;

    (2)可以对单独的分区进行备份和恢复;

    (3)可以将分区映射到不同的物理磁盘上,来分散IO;

    (4)提高可管理性、可用性和性能。

    Oracle 10g提供了以下几种分区类型:

    (1)范围分区(range);

    (2)哈希分区(hash);

    (3)列表分区(list);

    (4)范围-哈希复合分区(range-hash);

    (5)范围-列表复合分区(range-list)。

    Range分区:

      Range分区是应用范围比较广的表分区方式,它是以列的值的范围来做为分区的划分条件,将记录存放到列值所在的range分区中。

    如按照时间划分,2010年1月的数据放到a分区,2月的数据放到b分区,在创建的时候,需要指定基于的列,以及分区的范围值。

    在按时间分区时,如果某些记录暂无法预测范围,可以创建maxvalue分区,所有不在指定范围内的记录都会被存储到maxvalue所在分区中。

    如:

    create table pdba (id number, time date) partition by range (time)

    (

    partition p1 values less than (to_date('2010-10-1', 'yyyy-mm-dd')),

    partition p2 values less than (to_date('2010-11-1', 'yyyy-mm-dd')),

    partition p3 values less than (to_date('2010-12-1', 'yyyy-mm-dd')),

    partition p4 values less than (maxvalue)

    )

    Hash分区:

      对于那些无法有效划分 范围的表,可以使用hash分区,这样对于提高性能还是会有一定的帮助。hash分区会将表中的数据平均分配到你指定的几个分区中,列所在分区是依据分区 列的hash值自动分配,因此你并不能控制也不知道哪条记录会被放到哪个分区中,hash分区也可以支持多个依赖列。

    如:

    create table test

    (

    transaction_id number primary key,

    item_id number(8) not null

    )

    partition by hash(transaction_id)

    (

    partition part_01 tablespace tablespace01,

    partition part_02 tablespace tablespace02,

    partition part_03 tablespace tablespace03

    );

    在这里,我们指定了每个分区的表空间。

    List分区:

      List分区也需要指定列的值,其分区值必须明确指定,该分区列只能有一个,不能像range或者hash分区那样同时指定多个列做为分区依赖列,但它的单个分区对应值可以是多个。

      在分区时必须确定分区列可能存在的值,一旦插入的列值不在分区范围内,则插入/更新就会失败,因此通常建议使用list分区时,要创建一个default分区存储那些不在指定范围内的记录,类似range分区中的maxvalue分区。

    在根据某字段,如城市代码分区时,可以指定default,把非分区规则的数据,全部放到这个default分区。

    如:

    create table custaddr
    (

    id varchar2(15 byte) not null,

    areacode varchar2(4 byte)
    )

    partition by list (areacode)
    ( partition t_list025 values ('025'), 
    partition t_list372 values ('372') , 
    partition t_list510 values ('510'),

    partition p_other values (default)

    )

    组合分区:

    如果某表按照某列分区之后,仍然较大,或者是一些其它的需求,还可以通过分区内再建子分区的方式将分区再分区,即组合分区的方式。

      组合分区呢在10g中有两种:range-hash,range-list。注意顺序,根分区只能是range分区,子分区可以是hash分区或list分区。

    如:

    create table test

    (

    transaction_id number primary key,

    transaction_date date

    )

    partition by range(transaction_date) subpartition by hash(transaction_id)

    subpartitions 3 store in (tablespace01,tablespace02,tablespace03)

    (

    partition part_01 values less than(to_date(’2009-01-01’,’yyyy-mm-dd’)),

    partition part_02 values less than(to_date(’2010-01-01’,’yyyy-mm-dd’)),

    partition part_03 values less than(maxvalue)

    );

     

     

    此文从以下几个方面来整理关于分区表的概念及操作:
    1.表空间及分区表的概念
    2.表分区的具体作用
    3.表分区的优缺点
    4.表分区的几种类型及操作方法
    5.对表分区的维护性操作.
    (1.) 表空间及分区表的概念
    表空间:
    是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表, 所以称作表空间。

    分区表:
    当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。

    ( 2).表分区的具体作用
    Oracle的表分区功能通过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。

    分 区功能能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从数据库管理员的角度 来看,一个分区后的对象具有多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是,从应用程序 的角度来看,分区后的表与非分区表完全相同,使用 SQL DML 命令访问分区后的表时,无需任何修改。

    什么时候使用分区表:
    1、表的大小超过2GB。
    2、表中包含历史数据,新的数据被增加都新的分区中。

    (3).表分区的优缺点
    表分区有以下优点:
    1、改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。
    2、增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;
    3、维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;
    4、均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能。

    缺点:
    分区表相关:已经存在的表没有方法可以直接转化为分区表。不过 Oracle 提供了在线重定义表的功能。

    (4).表分区的几种类型及操作方法

     

     一.范围分区:

     

    范围分区将数据基于范围映射到每一个分区,这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用的,并且分区键经常采用日期。举个例子:你可能会将销售数据按照月份进行分区。
    当使用范围分区时,请考虑以下几个规则:
    1、每一个分区都必须有一个VALUES LESS THEN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。
    2、所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。
    3、在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUE LESS THEN的值,同时包括空值。

     

    例一:
    假设有一个CUSTOMER表,表中有数据200000行,我们将此表通过CUSTOMER_ID进行分区,每个分区存储100000行,我们将每个分区保存到单独的表空间中,这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码,如下:

     

    复制代码 代码如下:

     


    CREATE TABLE CUSTOMER
    (
        CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
        FIRST_NAME  VARCHAR2(30) NOT NULL,
        LAST_NAME   VARCHAR2(30) NOT NULL,
        PHONEVARCHAR2(15) NOT NULL,
        EMAILVARCHAR2(80),
        STATUS       CHAR(1)
    )
    PARTITION BY RANGE (CUSTOMER_ID)
    (
        PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01,
        PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02
    )



    例二:按时间划分

    复制代码 代码如下:

     


    CREATE TABLE ORDER_ACTIVITIES
    (
        ORDER_ID      NUMBER(7) NOT NULL,
        ORDER_DATE    DATE,
        TOTAL_AMOUNT NUMBER,
        CUSTOTMER_ID NUMBER(7),
        PAID   CHAR(1)
    )
    PARTITION BY RANGE (ORDER_DATE)
    (
      PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY -2003','DD-MON-YYYY')) TABLESPACEORD_TS01,
      PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02,
      PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03
    )

     

    例三:MAXVALUE

     

    复制代码 代码如下:

     


    CREATE TABLE RangeTable
    (
      idd   INT PRIMARY KEY ,
      iNAME VARCHAR(10),
      grade INT 
    )
    PARTITION  BY  RANGE (grade)
    (
          PARTITION  part1 VALUES  LESS  THEN (1000) TABLESPACE  Part1_tb,
          PARTITION  part2 VALUES  LESS  THEN (MAXVALUE) TABLESPACE  Part2_tb
    );
     

     

    二.列表分区:

     

    该分区的特点是某列的值只有几个,基于这样的特点我们可以采用列表分区。

     

    例一

     

    复制代码 代码如下:

     


    CREATE TABLE PROBLEM_TICKETS
    (
        PROBLEM_ID   NUMBER(7) NOT NULL PRIMARY KEY,
        DESCRIPTION  VARCHAR2(2000),
        CUSTOMER_ID  NUMBER(7) NOT NULL,
        DATE_ENTERED DATE NOT NULL,
        STATUS       VARCHAR2(20)
    )
    PARTITION BY LIST (STATUS)
    (
          PARTITION PROB_ACTIVE   VALUES ('ACTIVE') TABLESPACE PROB_TS01,
          PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02

    )


     

    例二

     

    复制代码 代码如下:

     


    CREATE  TABLE  ListTable
    (
        id    INT  PRIMARY  KEY ,
        name  VARCHAR (20),
        area  VARCHAR (10)
    )
    PARTITION  BY  LIST (area)
    (
        PARTITION  part1 VALUES ('guangdong','beijing') TABLESPACE  Part1_tb,
        PARTITION  part2 VALUES ('shanghai','nanjing')  TABLESPACE  Part2_tb
    );
    )



    三.散列分区:

    这类分区是在列值上使用散列算法,以确定将行放入哪个分区中。当列的值没有合适的条件时,建议使用散列分区。
    散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。

     

    例一:

     

    复制代码 代码如下:

     


    CREATE TABLE HASH_TABLE
    (
      COL NUMBER(8),
      INF VARCHAR2(100)
    )
    PARTITION BY HASH (COL)
    (
      PARTITION PART01 TABLESPACE HASH_TS01,
      PARTITION PART02 TABLESPACE HASH_TS02,
      PARTITION PART03 TABLESPACE HASH_TS03
    )



    简写:

    复制代码 代码如下:

     


    CREATE TABLE emp
    (
        empno NUMBER (4),
        ename VARCHAR2 (30),
        sal   NUMBER
    )
    PARTITION BY  HASH (empno) PARTITIONS 8
    STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);
     

     

    hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数,Oracle中如果你要使用hash分区,只需指定分区的数量即可。建议分区的数量采用2的n次方,这样可以使得各个分区间数据分布更加均匀。

    四.组合范围散列分区

     

    这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,然后再按某列进行列表分区,分区之中的分区被称为子分区。

     

    复制代码 代码如下:

     


    CREATE TABLE SALES
    (
    PRODUCT_ID VARCHAR2(5),
    SALES_DATE DATE,
    SALES_COST NUMBER(10),
    STATUS VARCHAR2(20)
    )
    PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS)
    (
       PARTITION P1 VALUES LESS THAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009
      (
          SUBPARTITION P1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
          SUBPARTITION P1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
      ),
       PARTITION P2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD')) TABLESPACE rptfact2009
      (
          SUBPARTITION P2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
          SUBPARTITION P2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
      )
    )



    五.复合范围散列分区:

    这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,然后再按某列进行散列分区。

     

    复制代码 代码如下:

     


    create table dinya_test
     (
     transaction_id number primary key,
     item_id number(8) not null,
     item_description varchar2(300),
     transaction_date date
     )
     partition by range(transaction_date)subpartition by hash(transaction_id)  subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03)
     (
         partition part_01 values less than(to_date(‘2006-01-01','yyyy-mm-dd')),
         partition part_02 values less than(to_date(‘2010-01-01','yyyy-mm-dd')),
         partition part_03 values less than(maxvalue)
     );
     

     

    (5).有关表分区的一些维护性操作:

     

    一、添加分区

     

    以下代码给SALES表添加了一个P3分区

     

    复制代码 代码如下:

     


    ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));

     

    注意:以上添加的分区界限应该高于最后一个分区界限。
    以下代码给SALES表的P3分区添加了一个P3SUB1子分区

     

    复制代码 代码如下:

     


    ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');

     

    二、删除分区
    以下代码删除了P3表分区:

     

    复制代码 代码如下:

     


    ALTER TABLE SALES DROP PARTITION P3;
     

     

    在以下代码删除了P4SUB1子分区:

     

    复制代码 代码如下:

     


    ALTER TABLE SALES DROP SUBPARTITION P4SUB1;
     

     

    注意:如果删除的分区是表中唯一的分区,那么此分区将不能被删除,要想删除此分区,必须删除表。
    三、截断分区

     

    截断某个分区是指删除某个分区中的数据,并不会删除分区,也不会删除其它分区中的数据。当表中即使只有一个分区时,也可以截断该分区。通过以下代码截断分区:

     

    复制代码 代码如下:

     


    ALTER TABLE SALES TRUNCATE PARTITION P2;
     

     

    通过以下代码截断子分区:

     

    复制代码 代码如下:

     


    ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;
     

     

    四、合并分区

     

    合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并:

     

    复制代码 代码如下:

     


    ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;
     

     

    五、拆分分区

     

    拆分分区将一个分区拆分两个新分区,拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。

     

    ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22);
     

     

    六、接合分区(coalesca)
    结合分区是将散列分区中的数据接合到其它分区中,当散列分区中的数据比较大时,可以增加散列分区,然后进行接合,值得注意的是,接合分区只能用于散列分区中。通过以下代码进行接合分区:

     

    复制代码 代码如下:

     


    ALTER TABLE SALES COALESCA PARTITION;

     

    七、重命名表分区

     

    以下代码将P21更改为P2

     

    复制代码 代码如下:

     


    ALTER TABLE SALES RENAME PARTITION P21 TO P2;
     

     

    八、相关查询

     

    跨分区查询

     

    复制代码 代码如下:

     


    select sum( *) from
    (select count(*) cn from t_table_SS PARTITION (P200709_1)
    union all
    select count(*) cn from t_table_SS PARTITION (P200709_2)
    );
     

     

    查询表上有多少分区

     

    复制代码 代码如下:

     


    SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME='tableName'
     

     

    查询索引信息

     

    复制代码 代码如下:


    select object_name,object_type,tablespace_name,sum(value)
    from v$segment_statistics
    where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX'
    group by object_name,object_type,tablespace_name
    order by 4 desc

    --显示数据库所有分区表的信息:
    select * from DBA_PART_TABLES

    --显示当前用户可访问的所有分区表信息:
    select * from ALL_PART_TABLES

    --显示当前用户所有分区表的信息:
    select * from USER_PART_TABLES

    --显示表分区信息 显示数据库所有分区表的详细分区信息:
    select * from DBA_TAB_PARTITIONS

    --显示当前用户可访问的所有分区表的详细分区信息:
    select * from ALL_TAB_PARTITIONS

    --显示当前用户所有分区表的详细分区信息:
    select * from USER_TAB_PARTITIONS

    --显示子分区信息 显示数据库所有组合分区表的子分区信息:
    select * from DBA_TAB_SUBPARTITIONS

    --显示当前用户可访问的所有组合分区表的子分区信息:
    select * from ALL_TAB_SUBPARTITIONS

    --显示当前用户所有组合分区表的子分区信息:
    select * from USER_TAB_SUBPARTITIONS

    --显示分区列 显示数据库所有分区表的分区列信息:
    select * from DBA_PART_KEY_COLUMNS

    --显示当前用户可访问的所有分区表的分区列信息:
    select * from ALL_PART_KEY_COLUMNS

    --显示当前用户所有分区表的分区列信息:
    select * from USER_PART_KEY_COLUMNS

    --显示子分区列 显示数据库所有分区表的子分区列信息:
    select * from DBA_SUBPART_KEY_COLUMNS

    --显示当前用户可访问的所有分区表的子分区列信息:
    select * from ALL_SUBPART_KEY_COLUMNS

    --显示当前用户所有分区表的子分区列信息:
    select * from USER_SUBPART_KEY_COLUMNS

    --怎样查询出oracle数据库中所有的的分区表
    select * from user_tables a where a.partitioned='YES'

    --删除一个表的数据是
    truncate table table_name;

    --删除分区表一个分区的数据是
    alter table table_name truncate partition p5;

     

     

  • 相关阅读:
    linux驱动开发学习一:创建一个字符设备
    如何高效的对有序数组去重
    找到缺失的第一个正整数
    .NET不可变集合已经正式发布
    中国人唯一不认可的成功——就是家庭的和睦,人生的平淡【转】
    自己动手搭建 MongoDB 环境,并建立一个 .NET HelloWorld 程序测试
    ASP.NET MVC 中如何用自定义 Handler 来处理来自 AJAX 请求的 HttpRequestValidationException 错误
    自己动手搭建 Redis 环境,并建立一个 .NET HelloWorld 程序测试
    ServiceStack 介绍
    一步一步实战扩展 ASP.NET Route,实现小写 URL、个性化 URL
  • 原文地址:https://www.cnblogs.com/bolang100/p/6803527.html
Copyright © 2011-2022 走看看