zoukankan      html  css  js  c++  java
  • 警示:强制关闭OGG进程触发bug致abended,详述处理过程

    导读:Oracle Golden Gate(OGG)是一种基于日志的结构化数据复制备份软件,是一种较为常用且很成熟的数据复制手段。但是当OGG版本为10.0.0.0 - 11.2.0.0.0时,如果强制关闭OGG 进程时,可能会触发Bug – 14552560- For data pump导致进程状态变为abended。在此我们分享一个近期的客户故障案例,供大家参考。

    关注“数据和云”公众号的读者们都知道,每月我们都会整理数据库行业热点问题,分享行业经验,警示异常故障,以其帮助更多的用户,维护数据库系统安全稳定运行。

    本文选自《云和恩墨技术通讯》(11月刊),下载地址:https://www.modb.pro/topic/5927(复制到浏览器中打开或者扫描下方二维码)

     

    问题描述


    某天早上5点左右,OGG源端所在服务器发生异常重启(已确认是存储损坏导致),服务器主机及ORACLE数据库恢复正常后,无法正常启动OGG。查看OGG进程,发现抽取和应用进程正常,但部分投递进程状态变为abended。

    问题分析


    查看异常进程报错如下:

    投递进程DPxxx、DPyyy、DPzzz等异常终止,进程报告提示读检查点的位置大于trail文件里记录的最大地址。

    ERROR OGG-01705 Input checkpoint position 321693396 for input trail  file '/xxx/xxxx/xxxx/dirdat/xxxxx' is greater than the size of the file (321052167).  Please consult Oracle Knowledge Management Doc ID 1138409.1. for  instructions.

    查看进程报告中提及到的MOS文档:OGG Extract / ReplicatCheckpoint RBA Is Larger than Local Trail Size (文档 ID1138409.1),文档里对此异常有明确的说明,属于OGG Bug – 14552560:Datadump Extract进程通常会读取磁盘缓存中的数据,而不是直接读取trail文件,如果主机突然重启,会导致缓存中的部分数据来不及写入到trail文件中,但是read checkpoint会把这部分数据记录为属于当前trail文件。而在下一次Datadump Extract启动时,会把主机重启前未写入trail文件的数据改写到下一个trail文件中,这就造成read checkpoint和实际数据所在trail文件产生出入。

    问题解决


    为保证OGG进程检查点的一致性,应尽量避免强制关闭OGG进程。

    针对此问题,可采用如下2种方式:

    1)进程重建

    源端重建后,应用进程参数文件需添加参数handlecollisions和reperror default,discard

    2)修改datadump extract检查点信息

    可参考MOS文档:OGGData Pump Extract Abend With GGS ERROR 190 and ZZ-0SD "Input CheckpointPosition <m> for Input Trail File <file> is Greater Than the Sizeof the File <n>" (文档 ID 1389086.1)

  • 相关阅读:
    [算法] 堆栈
    [刷题] PTA 02-线性结构3 Reversing Linked List
    java IO流 (八) RandomAccessFile的使用
    java IO流 (七) 对象流的使用
    java IO流 (六) 其它的流的使用
    java IO流 (五) 转换流的使用 以及编码集
    java IO流 (四) 缓冲流的使用
    java IO流 (三) 节点流(或文件流)
    java IO流 (二) IO流概述
    java IO流 (一) File类的使用
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13311833.html
Copyright © 2011-2022 走看看