zoukankan      html  css  js  c++  java
  • Oracle 10g Data Pump Expdp/Impdp 详解

     Data Pump 介绍

           在第一部分看了2段官网的说明, 可以看出数据泵的工作流程如下:

           (1)在命令行执行命令

           (2)expdp/impd 命令调用DBMS_DATAPUMP PL/SQL包。 这个API提供高速的导出导入功能。

           (3)当data 移动的时候, Data Pump 会自动选择direct path 或者external table mechanism 或者 两种结合的方式。 当metadata(对象定义) 移动的时候,Data Pump会使用DBMS_METADATA PL/SQL包。 Metadata API 将metadata(对象定义)存储在XML里。 所有的进程都能load 和unload 这些metadata.

           因为Data Pump 调用的是服务端的API, 所以当一个任务被调度或执行,客户端就可以退出连接,任务Job 会在server端继续执行,随后通过客户端实用程序从任何地方检查任务的状态和进行修改。

    在下面连接文章里对expdp/impdp 不同模式下的原理做了说明:

           exp/imp 与 expdp/impdp 对比 及使用中的一些优化事项

           http://blog.csdn.net/tianlesoftware/archive/2010/12/23/6093973.aspx

           在上面说了expdp/impdp 是JOB,我们可以停止与修改。 因此我们在这里做一个简答的测试:

    导出语句:

    expdp system/oracle full=y directory=dump dumpfile=orcl_%U.dmp parallel=2 job_name=davedump

           job_name:指定要导出Job的名称, 默认为SYS_XXX。 在前面已经说过, 调用的API都是Job。 我们为这个JOB命名一下, 等会还要用这个job name。

    C:/Users/Administrator.DavidDai>expdp system/oracle full=y directory=dump dumpfile=orcl_%U.dmp job_name=davedump

    Export: Release 11.2.0.1.0 - Production on 星期一 12月 27 15:24:38 2010

    Copyright (c) 1982, 2009, Oracle and/or its affiliates.  All rights reserved.

    连接到: Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - Production

    With the Partitioning, OLAP, Data Mining and Real Application Testing options

    启动 "SYSTEM"."DAVEDUMP":  system/******** full=y directory=dump dumpfile=orcl_%U.dmp job_name=davedump

    正在使用 BLOCKS 方法进行估计...

    处理对象类型 DATABASE_EXPORT/SCHEMA/TABLE/TABLE_DATA

    使用 BLOCKS 方法的总估计: 132.6 MB

    处理对象类型 DATABASE_EXPORT/TABLESPACE

    处理对象类型 DATABASE_EXPORT/PROFILE

    处理对象类型 DATABASE_EXPORT/SYS_USER/USER

    处理对象类型 DATABASE_EXPORT/SCHEMA/USER

    处理对象类型 DATABASE_EXPORT/ROLE

    处理对象类型 DATABASE_EXPORT/GRANT/SYSTEM_GRANT/PROC_SYSTEM_GRANT

    处理对象类型 DATABASE_EXPORT/SCHEMA/GRANT/SYSTEM_GRANT

    处理对象类型 DATABASE_EXPORT/SCHEMA/ROLE_GRANT

    处理对象类型 DATABASE_EXPORT/SCHEMA/DEFAULT_ROLE

    处理对象类型 DATABASE_EXPORT/SCHEMA/TABLESPACE_QUOTA

    处理对象类型 DATABASE_EXPORT/RESOURCE_COST

    处理对象类型 DATABASE_EXPORT/TRUSTED_DB_LINK

    处理对象类型 DATABASE_EXPORT/SCHEMA/SEQUENCE/SEQUENCE

    --按下CTRL+C 组合,退出交互模式

    Export>

    Export> status

    作业: DAVEDUMP

      操作: EXPORT

      模式: FULL

      状态: EXECUTING

      处理的字节: 0

      当前并行度: 1

      作业错误计数: 0

      转储文件: D:/BACKUP/ORCL_01.DMP

        写入的字节: 4,096

      转储文件: d:/Backup/orcl_%u.dmp

    Worker 1 状态:

      进程名: DW00

      状态: EXECUTING

      对象名: STORAGE_CONTEXT

      对象类型: DATABASE_EXPORT/CONTEXT

      完成的对象数: 7

      总的对象数: 7

      Worker 并行度: 1

    --停止作业

    Export> stop_job

    是否确实要停止此作业 ([Y]/N): yes

    --用job_name再次连接到job

    C:/Users/Administrator.DavidDai>expdp system/oracle attach=davedump

    -- ATTACH用于在客户会话与已存在导出作用之间建立关联. 如果使用ATTACH选项,在命令行除了连接字符串和ATTACH选项外,不能指定任何其他选

    Export: Release 11.2.0.1.0 - Production on 星期一 12月 27 15:26:14 2010

    Copyright (c) 1982, 2009, Oracle and/or its affiliates.  All rights reserved.

    连接到: Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - Production

    With the Partitioning, OLAP, Data Mining and Real Application Testing options

    作业: DAVEDUMP

      所有者: SYSTEM

      操作: EXPORT

      创建者权限: TRUE

      GUID: 454A188F62AA4D578AA0DA4C35259CD8

      开始时间: 星期一, 27 12月, 2010 15:26:16

      模式: FULL

      实例: orcl

      最大并行度: 1

      EXPORT 个作业参数:

      参数名      参数值:

         CLIENT_COMMAND        system/******** full=y directory=dump dumpfile=orcl_%U.dmp job_name=davedump

      状态: IDLING

      处理的字节: 0

      当前并行度: 1

      作业错误计数: 0

      转储文件: d:/Backup/orcl_01.dmp

        写入的字节: 950,272

      转储文件: d:/Backup/orcl_%u.dmp

    Worker 1 状态:

      进程名: DW00

      状态: UNDEFINED

    启动JOB

    Export> start_job

    -- 查看状态

    Export> status

    作业: DAVEDUMP

      操作: EXPORT

      模式: FULL

      状态: EXECUTING

      处理的字节: 0

      当前并行度: 1

      作业错误计数: 0

      转储文件: d:/Backup/orcl_01.dmp

        写入的字节: 954,368

      转储文件: d:/Backup/orcl_%u.dmp

    Worker 1 状态:

      进程名: DW00

      状态: EXECUTING

    在此期间的备份情况,可以使用status命令来查看:

    Export> status

    作业: DAVEDUMP

      操作: EXPORT

      模式: FULL

      状态: EXECUTING

      处理的字节: 0

      当前并行度: 1

      作业错误计数: 0

      转储文件: d:/Backup/orcl_01.dmp

        写入的字节: 954,368

      转储文件: d:/Backup/orcl_%u.dmp

    Worker 1 状态:

      进程名: DW00

      状态: EXECUTING

      对象方案: SYSMAN

      对象名: AQ$_MGMT_NOTIFY_QTABLE_T

      对象类型: DATABASE_EXPORT/SCHEMA/TABLE/TABLE

      完成的对象数: 59

      Worker 并行度: 1

    Export> help

    ------------------------------------------------------------------------------

    下列命令在交互模式下有效。

    注: 允许使用缩写。

    ADD_FILE

    将转储文件添加到转储文件集。

    CONTINUE_CLIENT

    返回到事件记录模式。如果处于空闲状态, 将重新启动作业。

    EXIT_CLIENT

    退出客户机会话并使作业保持运行状态。

    FILESIZE

    用于后续 ADD_FILE 命令的默认文件大小 (字节)。

    HELP

    汇总交互命令。

    KILL_JOB

    分离并删除作业。

    PARALLEL

    更改当前作业的活动 worker 的数量。

    REUSE_DUMPFILES

    覆盖目标转储文件 (如果文件存在) [N]。

    START_JOB

    启动或恢复当前作业。

    有效的关键字值为: SKIP_CURRENT。

    STATUS

    监视作业状态的频率, 其中

    默认值 [0] 表示只要有新状态可用, 就立即显示新状态。

    STOP_JOB

    按顺序关闭作业执行并退出客户机。

    有效的关键字值为: IMMEDIATE。

    Export>

    注意,就是在expdp命令进行交互式切换时,不能使用paralle 参数。 我在开始测试的时候,指定了这个参数,当stop_job后,在启动时就会报错。 说找不到指定的job_name.

    NLS_LANG 参数对expdp/impdp 影响:

    10G之前exp在导出数据时,数据字符集会依赖于NLS_LANG参数的设置,如果Client端设置了NLS_LANG参数,那么数据会按照NLS_LANG设置的字符集导出,如果没有则按照数据库本身的字符集导出; imp也一样 导入时也会参照NLS_LANG的设置在导入是对字符集做转换。

    qs-xe-dzora-pd:/home/oracle> echo$NLS_LANG

    American_America.zhs16gbk

    10G新增的expdp/impdp成为了一个服务器端的工具,也就是说导入导出任务在数据库服务器端运行,而不是在发出expdp/impdp命令的客户端(不过Oracle仍然还是保留了exp/imp工具)。

    在expdp的时候Oracle不会再依赖和参考NLS_LANG的设置,而是完全按照数据库本身的字符集导出数据,impdp的时候,Oracle会自动判断如果dmp文件中的字符集和目标数据库的字符集不符时会自动对导入数据的字符集做转换。这样可以消除以前由于字符集的问题在导入过程中出现乱码的问题。

    三、EXPDP/IMPDP 命令使用详解

           Data Pump包括导出表,导出方案,导出表空间,导出数据库4种方式.

    3.1  EXPDP命令参数及说明

    (1). ATTACH

           该选项用于在客户会话与已存在导出作用之间建立关联.语法如下

           ATTACH=[schema_name.]job_name

           Schema_name用于指定方案名,job_name用于指定导出作业名.注意,如果使用ATTACH选项,在命令行除了连接字符串和ATTACH选项外,不能指定任何其他选项,示例如下:

           Expdp scott/tiger ATTACH=scott.export_job

    (2). CONTENT

           该选项用于指定要导出的内容.默认值为ALL

           CONTENT={ALL | DATA_ONLY | METADATA_ONLY}

           当设置CONTENT为ALL 时,将导出对象定义及其所有数据.为DATA_ONLY时,只导出对象数据,为METADATA_ONLY时,只导出对象定义。

    Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dump CONTENT=METADATA_ONLY

    (3) DIRECTORY

    指定转储文件和日志文件所在的目录,DIRECTORY=directory_object

           Directory_object用于指定目录对象名称.需要注意,目录对象是使用CREATE DIRECTORY语句建立的对象,而不是OS 目录。

           Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dump

    先在对应的位置创建物理文件夹,如D:/backup

    建立目录:

           create or replace directory backup as '/opt/oracle/utl_file'

           SQL>CREATE DIRECTORY backup as ‘d:/backup’;

           SQL>grant read,write on directory backup to SYSTEM;

    查询创建了那些子目录:

           SELECT * FROM dba_directories;

    (4). DUMPFILE

           用于指定转储文件的名称,默认名称为expdat.dmp

           DUMPFILE=[directory_object:]file_name [,….]

           Directory_object用于指定目录对象名,file_name用于指定转储文件名.需要注意,如果不指定directory_object,导出工具会自动使用DIRECTORY选项指定的目录对象:Expdp scott/tiger DIRECTORY=dump1 DUMPFILE=dump2:a.dmp

    (5). ESTIMATE

           指定估算被导出表所占用磁盘空间分方法.默认值是BLOCKS。

                  EXTIMATE={BLOCKS | STATISTICS}

           设置为BLOCKS时,oracle会按照目标对象所占用的数据块个数乘以数据块尺寸估算对象占用的空间,设置为STATISTICS时,根据最近统计值估算对象占用空间:  Expdp scott/tiger TABLES=emp ESTIMATE=STATISTICS DIRECTORY=dump DUMPFILE=a.dump

    (6). EXTIMATE_ONLY

           指定是否只估算导出作业所占用的磁盘空间,默认值为N

                  EXTIMATE_ONLY={Y | N}

           设置为Y时,导出作用只估算对象所占用的磁盘空间,而不会执行导出作业,为N时,不仅估算对象所占用的磁盘空间,还会执行导出操作.

           Expdp scott/tiger ESTIMATE_ONLY=y NOLOGFILE=y

    (7). EXCLUDE

           该选项用于指定执行操作时释放要排除对象类型或相关对象

                  EXCLUDE=object_type[:name_clause] [,….]

           Object_type用于指定要排除的对象类型,name_clause用于指定要排除的具体对象.EXCLUDE和INCLUDE不能同时使用。

           Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dup EXCLUDE=VIEW

    (8). FILESIZE

           指定导出文件的最大尺寸,默认为0,(表示文件尺寸没有限制)

    (9). FLASHBACK_SCN

           指定导出特定SCN时刻的表数据。FLASHBACK_SCN=scn_value

           Scn_value用于标识SCN值.FLASHBACK_SCN和FLASHBACK_TIME不能同时使用: Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp FLASHBACK_SCN=358523

    (10). FLASHBACK_TIME

           指定导出特定时间点的表数据

           FLASHBACK_TIME=”TO_TIMESTAMP(time_value)”

           Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp FLASHBACK_TIME= “TO_TIMESTAMP(’25-08-2004 14:35:00’,’DD-MM-YYYY HH24:MI:SS’)”

    (11). FULL

           指定数据库模式导出,默认为N。 FULL={Y | N} 。为Y时,标识执行数据库导出.

    (12). HELP

           指定是否显示EXPDP命令行选项的帮助信息,默认为N。当设置为Y时,会显示导出选项的帮助信息. Expdp help=y

    (13). INCLUDE

           指定导出时要包含的对象类型及相关对象。INCLUDE = object_type[:name_clause] [,… ]

    (14). JOB_NAME

           指定要导出作用的名称,默认为SYS_XXX 。JOB_NAME=jobname_string

    (15). LOGFILE

           指定导出日志文件文件的名称,默认名称为export.log

                  LOGFILE=[directory_object:]file_name

           Directory_object用于指定目录对象名称,file_name用于指定导出日志文件名.如果不指定directory_object.导出作用会自动使用DIRECTORY的相应选项值.

           Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp logfile=a.log

    (16). NETWORK_LINK

           指定数据库链接名,如果要将远程数据库对象导出到本地例程的转储文件中,必须设置该选项.

    (17). NOLOGFILE

           该选项用于指定禁止生成导出日志文件,默认值为N.

    (18). PARALLEL

    指定执行导出操作的并行进程个数,默认值为1

    (19). PARFILE

           指定导出参数文件的名称。PARFILE=[directory_path] file_name

    (20). QUERY

           用于指定过滤导出数据的where条件

                  QUERY=[schema.] [table_name:] query_clause

           Schema用于指定方案名,table_name用于指定表名,query_clause用于指定条件限制子句.QUERY选项不能与CONNECT=METADATA_ONLY,EXTIMATE_ONLY,TRANSPORT_TABLESPACES等选项同时使用.  

           Expdp scott/tiger directory=dump dumpfiel=a.dmp Tables=emp query=’WHERE deptno=20’

    (21). SCHEMAS

           该方案用于指定执行方案模式导出,默认为当前用户方案.

    (22). STATUS

           指定显示导出作用进程的详细状态,默认值为0

    (23). TABLES

           指定表模式导出

                  TABLES=[schema_name.]table_name[:partition_name][,…]

           Schema_name用于指定方案名,table_name用于指定导出的表名,partition_name用于指定要导出的分区名.

    (24). TABLESPACES

           指定要导出表空间列表

    (25). TRANSPORT_FULL_CHECK

           该选项用于指定被搬移表空间和未搬移表空间关联关系的检查方式,默认为N. 当设置为Y时,导出作用会检查表空间直接的完整关联关系,如果表空间所在表空间或其索引所在的表空间只有一个表空间被搬移,将显示错误信息.当设置为N时,导出作用只检查单端依赖,如果搬移索引所在表空间,但未搬移表所在表空间,将显示出错信息,如果搬移表所在表空间,未搬移索引所在表空间,则不会显示错误信息.

    (26). TRANSPORT_TABLESPACES

           指定执行表空间模式导出

    (27). VERSION

           指定被导出对象的数据库版本,默认值为COMPATIBLE.

           VERSION={COMPATIBLE | LATEST | version_string}

           为COMPATIBLE时,会根据初始化参数COMPATIBLE生成对象元数据;为LATEST时,会根据数据库的实际版本生成对象元数据.version_string用于指定数据库版本字符串.

    关于Version 的更多说明,参考:

    Export/Import DataPump Parameter VERSION - Compatibility of Data Pump Between Different Oracle Versions [Video] [ID 553337.1]

    3.2  EXPDP 使用示例

           使用EXPDP工具时,其转储文件只能被存放在DIRECTORY对象对应的OS目录中,而不能直接指定转储文件所在的OS目录.因此,使用EXPDP工具时,必须首先建立DIRECTORY对象.并且需要为数据库用户授予使用DIRECTORY对象权限.

    CREATE DIRECTORY dump_dir AS ‘D:/DUMP’;

    GRANT READ, WIRTE ON DIRECTORY dump_dir TO scott;

    (1)导出表

           Expdp scott/tiger DIRECTORY=dump_dir DUMPFILE=tab.dmp TABLES=dept,emp logfile=exp.log;

     

    (2)导出方案 (schema,与用户对应)

           Expdp scott/tiger DIRECTORY=dump_dir DUMPFILE=schema.dmp SCHEMAS=system,scott logfile=/exp.log;

     

    (3)导出表空间

           Expdp system/manager DIRECTORY=dump_dir DUMPFILE=tablespace.dmp TABLESPACES=user01,user02 logfile=/exp.log;

     

    (4)导出数据库

           Expdp system/manager DIRECTORY=dump_dir DUMPFILE=full.dmp FULL=Y logfile=/exp.log;

     

    3.3  IMPDP 命令参数说明

           IMPDP命令行选项与EXPDP有很多相同的,不同的有:

    (1)REMAP_DATAFILE

           该选项用于将源数据文件名转变为目标数据文件名,在不同平台之间搬移表空间时可能需要该选项.

           REMAP_DATAFIEL=source_datafie:target_datafile

    (2)REMAP_SCHEMA

           该选项用于将源方案的所有对象装载到目标方案中.

           REMAP_SCHEMA=source_schema:target_schema

    (3)REMAP_TABLESPACE

           将源表空间的所有对象导入到目标表空间中

           REMAP_TABLESPACE=source_tablespace:target_tablespace

    (4)REUSE_DATAFILES

           该选项指定建立表空间时是否覆盖已存在的数据文件.默认为N。

           REUSE_DATAFIELS={Y | N}

    (5)SKIP_UNUSABLE_INDEXES

           指定导入是是否跳过不可使用的索引,默认为N

    (6)SQLFILE

           指定将导入要指定的索引DDL操作写入到SQL脚本中。

           SQLFILE=[directory_object:]file_name

           Impdp scott/tiger DIRECTORY=dump DUMPFILE=tab.dmp SQLFILE=a.sql

    (7)STREAMS_CONFIGURATION

           指定是否导入流元数据(Stream Matadata),默认值为Y.

    (8)TABLE_EXISTS_ACTION

           该选项用于指定当表已经存在时导入作业要执行的操作,默认为SKIP

                  TABBLE_EXISTS_ACTION={SKIP | APPEND | TRUNCATE | FRPLACE }

           当设置该选项为SKIP时,导入作业会跳过已存在表处理下一个对象;当设置为APPEND时,会追加数据,为TRUNCATE时,导入作业会截断表,然后为其追加新数据;当设置为REPLACE时,导入作业会删除已存在表,重建表病追加数据,注意,TRUNCATE选项不适用与簇表和NETWORK_LINK选项

    (9)TRANSFORM

           该选项用于指定是否修改建立对象的DDL语句

                  TRANSFORM=transform_name:value[:object_type]

           Transform_name用于指定转换名,其中SEGMENT_ATTRIBUTES用于标识段属性(物理属性,存储属性,表空间,日志等信息),STORAGE用于标识段存储属性,VALUE用于指定是否包含段属性或段存储属性,object_type用于指定对象类型.

           Impdp scott/tiger directory=dump dumpfile=tab.dmp Transform=segment_attributes:n:table

    (10)TRANSPORT_DATAFILES

           该选项用于指定搬移空间时要被导入到目标数据库的数据文件。

                  TRANSPORT_DATAFILE=datafile_name

           Datafile_name用于指定被复制到目标数据库的数据文件

    Impdp system/manager DIRECTORY=dump DUMPFILE=tts.dmp TRANSPORT_DATAFILES=’/user01/data/tbs1.f’

    3.4 IMPDP 命令实例

    (1)导入表

    Impdp scott/tiger DIRECTORY=dump_dir DUMPFILE=tab.dmp TABLES=dept,emp logfile=/exp.log;

    --将DEPT和EMP表导入到SCOTT方案中

     

    Impdp system/manage DIRECTORY=dump_dir DUMPFILE=tab.dmp

    TABLES=scott.dept,scott.emp REMAP_SCHEMA=SCOTT:SYSTEM logfile=/exp.log;

    -- 将DEPT和EMP表导入的SYSTEM方案中.

     

    (2)导入方案

    Impdp scott/tiger DIRECTORY=dump_dir DUMPFILE=schema.dmp SCHEMAS=scott logfile=/exp.log;

     

    Impdp system/manager DIRECTORY=dump_dir DUMPFILE=schema.dmp

    SCHEMAS=scott REMAP_SCHEMA=scott:system logfile=/exp.log;

     备注:导入语句要注意如果是从scott用户导出的对象,那默认情况下导入的用户还是scott用户,如果要从scott用户导出,然后导入到test用户下,那就需要用到下面的语句实现用户(模式)之间的转换:

         expdp scott/huawei_123 directory=dump_dir dumpfile=user.dmp  

      impdp test/huawei_123 directory=dump_dir dumpfile=user.dmp remap_schema=scott:test

    (3)导入表空间

    Impdp system/manager DIRECTORY=dump_dir DUMPFILE=tablespace.dmp TABLESPACES=user01 logfile=/exp.log;

     

    (4)导入数据库

    Impdp system/manager DIRECTORY=dump_dir DUMPFILE=full.dmp FULL=y logfile=/exp.log;

    转载:http://blog.csdn.net/tianlesoftware/article/details/4674224#comments

  • 相关阅读:
    启动hadoop集群的时候只能启动一个namenode,另一个报错There appears to be a gap in the edit log. We expected txid 6, but got txid 10.
    YARN的HA
    CSS3 文本效果:text-shadow、box-shadow、text-overflow、word-wrap、word-break
    CSS3 渐变(Gradients):在两个或多个指定的颜色之间显示平稳的过渡
    CSS3 背景:几个新的背景属性,提供更大背景元素控制
    CSS3 圆角:使用 CSS3 border-radius 属性,你可以给任何元素制作 "圆角"
    CSS3 边框:创建圆角边框,添加阴影框
    CSS 网页布局的集中实现方式
    CSS 计数器:通过一个变量来设置,根据规则递增变量
    CSS 表单:使用 CSS 来渲染 HTML 的表单元素
  • 原文地址:https://www.cnblogs.com/trhimily/p/3863437.html
Copyright © 2011-2022 走看看