zoukankan      html  css  js  c++  java
  • ORACLE 10G RAC 节点自己主动重新启动故障处理

    版权声明:本文为博主原创文章,未经博主同意不得转载。

    个人技术站点:http://www.ezbit.ren https://blog.csdn.net/joeadai/article/details/34883561

    将数据库集群升级到10.2.0.5之后,双节点server不断重新启动。查询oracle oprocd进程日志。信息例如以下:

    Jul 03 08:16:34.702 | INF | monitoring started with timeout(1000), margin(500), skewTimeout(125)
    Jul 03 08:16:34.704 | INF | fatal mode startup, setting process to fatal mode

    能够看到看到oprocd进程的时间间隔设置为

    timeout(1000), margin(500), skewTimeout(125)

    查看其他的日志信息,没有发现明显的错误信息,因此怀疑是oprocd的时间參数设置不当。

    改动參数例如以下:

    #crsctl set css diagwait 13 -force

    改动參数时,须要注意例如以下几个事项

    当我们设置diagwait參数时,须要停止全部rac节点的集群活动。停止顺序例如以下(假设集群式活动的。改动diagwait有可能会损害ocr):

    1,以root用户在全部节点执行

    #crsctl stop crs 
    #<CRS_HOME>/bin/oprocd stop

    2,确认全部节点的进程已经停止

    #ps -ef |egrep "crsd.bin|ocssd.bin|evmd.bin|oprocd"

    3,改动參数。只在一个节点改动就能够了

    #crsctl set css diagwait 13 -force
    4。查看參数改动情况

    #crsctl get css diagwait

    5,启动集群节点
    #crsctl start crs
    #crsctl check crs

    改动參数后。集群服务执行正常,没有再自己主动重新启动过。




  • 相关阅读:
    BZOJ 4710: [Jsoi2011]分特产
    P4859 已经没有什么好害怕的了
    BZOJ 2839 集合计数
    P1450 [HAOI2008]硬币购物
    P3440 [POI2006]SZK-Schools
    P4177 [CEOI2008]order
    对于最小割的进一步理解
    P2774 方格取数问题
    JAVA网络编程TCP通信
    JAVA多线程及补充
  • 原文地址:https://www.cnblogs.com/mqxnongmin/p/10925567.html
Copyright © 2011-2022 走看看