zoukankan      html  css  js  c++  java
  • OGG配置参数样例

    #命名规范:
        local==> l
        remote==> r
        extract==> x
        data pump==> p
        source Trail==>st
        Remote Trail==>rt
    --------------------------
    
    #《《源数据库orcl》》
    
    
    Extract:将重做日志信息抽取存放到本地exttrail文件中
    
        0.开启附加日志功能,开启强制日志模式;强烈建议源端每个涉及复制的表上建立主键或者唯一键
            
            SQL> alter database force logging;
            SQL> alter database add supplemental log data; #数据库最小级别开启
            SQL> create tablespace ggs datafile size 200M autoextend on; 
            SQL> create user ggs identified by ggs;
            SQL> grant dba to ggs;
    
            GGSCI> add trandata schema.<tablename>   #表别级别开启,给需要复制的表添加
            GGSCI> info trandata schema.<tablename>  #查看附加信息
            相关附加日志参数:
            注意: 每小时日志量评估
            select trunc(completion_time),count(*)*100 size_in_MB from
            v$archived_log group by trunc(Completion_time);
    
        1.安装OGG
              mkdir /goldengate
              tar xf ogg.tar -C /goldengate  #ogg.tar为软件名
              chown -R oracle:oinstall /goldengate
    
              cat>>/home/oracle/.bash_profile<<'EOF'
                  export GG_HOME=/goldengate
                  export LD_LIBRARY_PATH=$ORACLE_HOME/lib:$LD_LIBRARY_PATH
                  alias ggsci='ggsci $GG_HOME/ggsci'
              EOF
    
        2.创建子目录,编辑MGR
            GGSCI>create subdirs
            GGSCI>edit param mgr  添加下面端口
                 port 7809
                 AUTORESTART ER *, RETRIES 3, WAITMINUTES 5, RESETMINUTES 60
                 PURGEOLDEXTRACTS /goldengate/dirdat/*,USECHECKPOINTS,MINKEEPHOURS 24   #/goldengate/dirdat/*为抽取日志存放位置
    
        3.定义本地抽取参数文件
            GGSCI(Hostname) 1>edit param lxjack 
                extract lxjack
                ------------------------------------------------
                -- local extract for schema
                -- Author: vmsysjack
                -- Created Date: 2020-02-10
                ------------------------------------------------
                SETENV       (NLS_LANG=AMERICAN_AMERICA.ZHS16GBK) #和源系统一致select * from v$nls_parameters where parameters like '%NLS_CHARACTERSET%';
                USERID    ggs@orcl,password ggs  #定义连接抽取源的用户名和密码以及tns,orcl为源库的TNS名
                ExtTrail  dirdat/st              #定义抽取重做日志信息存储地点;将会在$GG_HOME/dirdat/下生成st开头文件
                Table     schema.tablename;      #定义需要抽取的“模式.表名”
    
            注意:当密码使用加密方式的时候,需要使用使用encryptkey default
                例如:    1. 生成密文
                          encrypt password ggs encryptkey default
    
                        2.将第一步生成的密文应用
                            userid ggs,password AAAAAAAAAAAAAAAAACCCCCSGSADGSDGWOXCJKLSJL,encryptkey default
    
        4. 创建extract进程
                    GGSCI(HOSTname) 1> add extract lxjack,threads 2,tranlog,begin now       #RAC源需要配置 ,threads 2表示有2个节点,单节点不用加threads 2 
                    GGSCI(Hostname) 2> add exttrail dirdat/st,extract lxjack,megabytes 100  #添加抽取源文件位置和大小
    
                    注意:当在操作系统删除了exttrail文件后,启动会报 PROCESS ABENDING,使用下面方法解决
                    (1). GGSCI>delete exttrail dirdat/st*  #我这里是测试环境,只有一个文件
                    (2). GGSCI>add exttrail dirdat/st,extract lxjack
    
        5. 启动extract进程,验证extract进程
                    GGSCI(Hostname) 3> start extract lxjack
                    GGSCI(Hostname) 4> info extract lxjack   # l=>local; x=>extract;
                    GGSCI(Hostname) 5> info extract lxjack,showch
                    GGSCI(Hostname) 5> info extract lxjack,detail
    
        6. 验证抽取数据
                GGSCI(Hostname) 5> stats extract lxjack  #再重新开启一个终端,执行DML语句,使用stats extract lxjack查看
    
                注意: 级联更新带来的问题
                    级联更新的触发器等对象存在,对于目标数据库系统上应该关闭或者禁用掉目标
                    数据库上的触发器和级别约束;使用如下语句:
                        SQL> alter table ... disable contraint ...
                        SQL> alter trigger ... disable ...
                        或者使用下面语句:需要数据库版本是10.2.0.5或11.2.0.2之后版本
                        DBOPTIONS suppresstriggers
                
    配置DataPump: 
               本质上是一个Extract Group,需要参数文件,参数文件名字和这个extract group的组名一样。
               参数中需要配置SourceTrail文件在哪里,以及发送的目标系统在哪里
     
        1.定义参数文件          
                   GGSCI(Hostname) 1>edit param lpjack   # l=>local;  p=>pump
                   extract lpjack
                   -------------------------------------------
                   -- Data Pump extract for schema.tablename
                   -- Author: vmsysjack
                   -- Created Date: 2020-02-10
                   --------------------------------------------
                   Uerid ggs@orcl,password ggs
                   PassThru  #透传模式,源表和目标数据库表完全一样,源表与目标表不一致的时候需要用NoPassThru
                   RmtHost   目标主机ip地址,Mgrtort 目标主机mgr进程端口  #定义连接远端主机和端口
                   RmtTrail  dirdat/rt     #定义Remote Trail文件的文件名前缀,r=>remote;表示传递到远端的位置
                   Table     schema.tablename; #传递的表名
    
        2. 创建Data Pump进程
                    GGSCI(Host) 1> add extract lpjack,exttrailsource dirdat/st #定义DataPump进程名,以及需要抽取的源trail文件位置dirdat/st
                    GGSCI(Host) 2> add rmttrail dirdat/rt,extract lpjack,megabytes 100 #定义增加远程trail文件位置和远程trail文件大小
    
        3. 启动Data Pump进程,验证Data Pump进程,统计抽取进程数据
            GGSCI(Host) 3> start extract lpjack
            GGSCI(Host) 4> info extract lpjack
            GGSCI(Host) 5> stats extract lpjack
    
    ##《《目标数据库vmsys》》
    
        0.创建目标数据库需要的表空间和用户
            SQL> create tablespace ggt datafile size 200M autoextend on;
            SQL> create user ggt identified  by ggt;
            SQL> grant dba to ggt;
    
        1.创建全局参数文件,登录目标数据库,创建检查点表
            注意:检查点表作为事务处理的一部分,可以有更好的恢复能力,有共用和专用两种做法
                共用: 所有的replicate共用一个
                专用: 每个replicate独立创建一个
                
                GGSCI(Hostname) 1> edit param ./GLOBALS  #需要执行GGSCI,在GG_HOME目录下
                    GGschema  ggt                     #指定存储架构,此行也可以不写
                    checkpointtable ggt.chkpt            #存储在ggt用户模式下
    
                GGSCI(Hostname) 2> dblogin userid ggt@vmsys,password ggt  #vmsys为目标数据库网络服务名
         
         2. 从数据库层面检查检查点文件
                SQL> show user; --当前还未增加检查点文件
                USER is "ggt"
    
                SQL> select table_name from user_tables;  --ggt模式下没有表
                no rows selected
    
                GGSCI(Hostname) 3> add checkpointtable  --增加检查点表文件
                GGSCI(Hostname) 4> info checkpointtable
    
                SQL> conn ggt/ggt  #ggt为目标数据库创建的用户,即目标数据库登录GGSCI使用的用户
                SQL> desc chkpt
                SQL> desc chkpt_lox
    
                SQL> show user;
                USER is "ggt"
    
                SQL> select table_name from user_tables;
    
                TABLE_NAME
                ------------------------------
                CHKPT_LOX
                CHKPT
    
                SQL> desc chkpt_lox;
                 Name                                      Null?    Type
                 ----------------------------------------- -------- ----------------------------
                 GROUP_NAME                                NOT NULL VARCHAR2(8)
                 GROUP_KEY                                 NOT NULL NUMBER(19)
                 LOG_CMPLT_CSN                             NOT NULL VARCHAR2(129)
                 LOG_CMPLT_XIDS_SEQ                        NOT NULL NUMBER(5)
                 LOG_CMPLT_XIDS                            NOT NULL VARCHAR2(2000)
    
                SQL> desc chkpt;
                 Name                                      Null?    Type
                 ----------------------------------------- -------- ----------------------------
                 GROUP_NAME                                NOT NULL VARCHAR2(8)
                 GROUP_KEY                                 NOT NULL NUMBER(19)
                 SEQNO                                              NUMBER(10)
                 RBA                                       NOT NULL NUMBER(19)
                 AUDIT_TS                                           VARCHAR2(29)
                 CREATE_TS                                 NOT NULL DATE
                 LAST_UPDATE_TS                            NOT NULL DATE
                 CURRENT_DIR                               NOT NULL VARCHAR2(255)
                 LOG_CSN                                            VARCHAR2(129)
                 LOG_XID                                            VARCHAR2(129)
                 LOG_CMPLT_CSN                                      VARCHAR2(129)
                 LOG_CMPLT_XIDS                                     VARCHAR2(2000)
                 VERSION                                            NUMBER(3)
    
                SQL> 
    
    注意: replicate级别增加checkpointTable方式:
            GGSCI> add replicat rejack,exttrail /goldengate/dirdat/vmsys/rt,checkpointTable ggt,rejackcht  
    
            --专有级别创建检查点文件,每个replicat都需要创建一个,各个replicate各自使用; 通过发现这种方式不会自动生成检查表,还是需要手工建立
            create table rejack as select * chkpt where 0=1;
            create table rejack_lox as select * chkpt where 0=1;
    
    开始数据加载.....
    .....
    ..... 当源表之前有数据的时候,需要通过exp,imp(impdump,expdump)存放到目标中
    .....
    
    配置Replicat进程
        
        1. 定义replicat参数文件
                GGSCI(Hostname) 1> edit param rejack  #e=>replicat
                    replicat  rejack
                    --------------------------------------------
                    -- replicat for jack.a
                    -- author: vmsysjack
                    -- Created Date: 2020-02-10
                    --------------------------------------------
                    SETENV  (NLS_LANG=AMERICAN_AMERICA.ZHS16GBK)
                    USERID  ggt@vmsys,password ggt  #vmsys为目标表的TNS
                    HandleCollisions  #处理冲突的数据,只能在数据初始化期间使用,后续不能使用这个处理冲突
                    AssumeTargetDefs  #源数据表与目标数据库同步的表定义相同时候用此参数,不可以与sourcedefs参数文件同用
                    Map jack.*,Target jack.*;
    
        2. 创建replicat进程
                GGSCI(Hostname) 1> add replicat rejack,exttrail dirdat/rt
    
        3. 启动replicat进程
                GGSCI(Hostname) 2> start replicat rejack
    
        4. 查看并验证replicat
                GGSCI(Hostname) 3> info replicat rejack
                GGSCI(Hostname) 4> stats replicat rejack
    
                
    
    ===================================================================
    一. 表过滤
        1. extract端:
            Table  schema.tablename
        2. replicat端:
            Map srcSchema.tablename,Target dstSchema.tablename
    
    二. 列过滤: 只用抓取或者只复制指定的列,不是所有的列
        1. extract端:
            Table schema.tablename COLS(cola,colb.....);
         注意: 列过滤不可以使用passthru
    
        2. 使用colsExcept 抓取除了列出来的列之外的所有列
            Table schema.tablename colsExcept(colx);      
    
    三. 行过滤: 只复制满足条件的行,分为两种类型(Complex和Non-Complex)
        1. Non-Complex类型:非复杂类型;只能根据行过滤,支持@present,@absent,@null
            1). extract端
                    Table schema.tablename,where (id<100);
            2). replicat端
                    Map schema.tablename,Target schema.tablename,where (id<100);
    
        2. Complex类型:复杂类型,支持各种GG函数,还可以安装操作类型过滤(filter实现)
          for example:
            2.1) 发生在id<100记录上的delete操作语句
                 Map schema.tablename,Target schema.tablename,filter (on delete,id<100);
    
            2.2) 只捕获id<100的记录
                 Map schema.tablename,Target schema.tablename,filter (id<100);
    
            2.3) 只捕获更新,删除操作,以及id<100的记录
                 Table schema.tablename,filter (on delete,on update,id>100);
    
            2.4)列Name中有zhang字样的
                 Table schema.tablename,Filter (@StrFind(name,'zhang')>0)
    
            2.5)函数计算的结果大于120000
                Table schema.tablename,Filter (@compute((salary-tax)*12)>120000)
    
    四. 数据映射,既可以在源端进行,也可以在目标端进行
    
    
    #extract端配置样例1:
        extract   lxjack
        SETENV      (ORACLE_SID=orcl)
        USERID    ggs,PASSWORD ggs
        ExtTrail  ./dirdat/sx
        TranLogOptions  ExcludeUser(username)
        Table   sometable;
    
    #extract端配置样例2:
        extract   lxjack
        SETENV      (ORACLE_SID=orcl)
        USERID    ggs,PASSWORD ggs
        ExtTrail  ./dirdat/sx
        TranLogOptions  ExcludeUser(username)
        Table src.serviceChange,Target tgt.serviceChareg_DIM, #源表与目标表做映射
        colMap(UseDefaults,ID=ServiceChareg_id,modified_at=Timeap); #usedefaults没有明确指出的列在两边都是相同的;需要映射的列需要在usedefaults后面表示出来。
    
    
    #replicat端配置样例3:
        replicat              lrlog5
        SETENV                (NLS_LANG=AMERICAN_AMERICA.ZHS16GBK)
        SETENV                  (ORACLE_SID=vmsys)
        UserId                ggt,password ggt
        HandleCollisions      
        SourceDefs            dirdef/smsg_logs.defs  #此文件需要定义文件
        Map                   jack.smsg_logs,Target jack.smsg_logs,
        ColMap(UseDefaults,owner="zhangsan")  #在列映射中给这个列加上一个初始值;每当源表中插入新记录,这个新记录复制到目标数据表后,owner字段会被自动赋值为zhangsan
    
    
    #replicat端映射配置样例:
        1). 当源表与目标表结构一致,在replicat参数文件中使用AssumeTargetDefs参数,代表两端结构一致。
    
        2). 当源表与目标表结构不一致,需要映射,映射语句:
            Map schema.tablename,Target schema.tablename,Colmap (UseDefaults,cola=cola);
    
    
    --------------------------------------------------------------------------------------------------
    
    需要哪一个数据库的数据定义文件,取决于映射操作是在哪里进行的,如果在目标端(replicat)完成映射,需要在源数据库定义文件,然后将生成的文件复制到目标数据库上,最后在replicat参数文件中引用它;
    如果在源端(extract)完成映射,就反过来。
    
    1.创建数据定义文件:
        GGSCI(Hostname) 1> edit params defgen
        DefsFile   ./dirdef/rejackt2.defs #用未来要引用这个定义文件的replicat组名字来命名
        UserId  ggs,Password ggs
        Table   schema.tablename;
    
    2.将定义文件使用工具生成定义文件:
        ./defgen  paramfile dirtrm/defgen.prm 
    
    3.将第二步生成的defgen.prm复制到另外一台机器的$GG_HOME/dirdef文件夹中
    
    4.修改参数
        4.1)注释文本-->>AssumeTargetDefs
             增加文本-->>SourceDefs dirdef/rejackt2.defs
    -----------------------------
    colmap(Usedefaults,owner="liulingfeng",ab=)  目标表有一列为空应该将这列写最后
    colmap(Usedefaults,ab=,owner="liulingfeng")  目标表一列为空这种写法是错误的
    AssumeTargetDefs 当能够通过colmap实现和源结构一致的情况下可以使用此参数,前提要表的结构一致
    定义文件用于当源表和目标表不一致的情况下.可以使用.
    
    --------------------------------------------------------------------------
    1. 设置Trail文件的删除策略:
        将下面的参数写入到Manager进程的参数文件中
        PurgeOldExtracts  /ggs/dirdat/sa*,
        UseCheckpoints,       --使用检查点
        MinKeepHours 1;       --即使检查点确认了删除后,还保留一个小时
        FrequencyMinutes 30;  --清理动作的频率为30分钟一次
    
    2. 数据压缩
        GG提供了数据压缩功能,对于低带宽的网络是有意义的,当设置了压缩,目标端Collector进程会自动的进行解压缩操作,然后写入Remote Trail文件中;数据的最大压缩比例可以达到5:1,默认数据不压缩。
        例如:
        Extract lpjack
        PassThru
        RmtHost   dstIP,Mgrtort 7809,Compress,CompressThreshold 2048
        #compressThreshold 2048 为压缩的最小数据块单位大小
        RmtTrail  dirdat/rs
        Table     schema.tablename;
    
    --------------------------------------------------------------------------
    1. 执行存储过程
        Map source_table,Target target_table,
        SQLEXEC (SPNAME spanme,PARAME (in_paraml=cola)), 
                #SPNAME指定存储过程名字,PARAMS参数定义的是IN参数和列的映射关系
        COLMAP (Usedefaults,coln=@GETVAL(spname,out_paramn));
    
    select name,value from v$diag_info; #获取跟踪诊断的相关信息
    
    select * from v$pwfile_users; #获取授予sysdba权限的用户
  • 相关阅读:
    java web开发小记(5)
    java web开发小记(4)
    java web开发小记(3)
    java web开发小记(2)
    java web开发小记(1)
    Myeclipse10小记
    jackson 转换 yyyy-MM-dd格式 少了一个小时问题解决(仅限中国)
    mysql,给每一条数据的某一个字段生成不同的随机数
    mybatis 表情存储报错问题解决
    spring cloud jackson 枚举json互转 枚举json序列化/反序列化
  • 原文地址:https://www.cnblogs.com/vmsysjack/p/12426867.html
Copyright © 2011-2022 走看看