zoukankan      html  css  js  c++  java
  • EMERGENCY! EUREKA MAY BE INCORRECTLY CLAIMING INSTANCES ARE UP WHEN THEY'RE NOT. RENEWALS ARE LESSER THAN THRESHOLD AND HENCE THE INSTANCES ARE NOT BEING EXPIRED JUST TO BE SAFE.

    一、触发原因简要说下


     

    启动两个client,过了一会,停了其中一个,访问注册中心时,界面上显示了红色粗体警告信息:

    查阅了很多资料,终于了解了中间的问题。现将理解整理如下:

    Eureka server和client之间每隔30秒会进行一次心跳通信,告诉server,client还活着。由此引出两个名词: 
    Renews threshold:server期望在每分钟中收到的心跳次数 
    Renews (last min):上一分钟内收到的心跳次数。

    前文说到禁止注册server自己为client,不管server是否禁止,阈值(threshold)是1。client个数为n,阈值为1+2*n(此为一个server且禁止自注册的情况) 
    如果是多个server,且开启了自注册,那么就和client一样,是对于其他的server来说就是client,是要*2的

    我开了两个server,自注册,相关数据如下 
     
    阈值:1+2*1 
    renews: 
    1)自注册 2 + 2*1 
    2)非自注册:2*1

    Eurake有一个配置参数eureka.server.renewalPercentThreshold,定义了renews 和renews threshold的比值,默认值为0.85。当server在15分钟内,比值低于percent,即少了15%的微服务心跳,server会进入自我保护状态,Self-Preservation。在此状态下,server不会删除注册信息,这就有可能导致在调用微服务时,实际上服务并不存在。 
    这种保护状态实际上是考虑了client和server之间的心跳是因为网络问题,而非服务本身问题,不能简单的删除注册信息

    stackoverflow上,有人给出的建议是: 
    1、在生产上可以开自注册,部署两个server 
    2、在本机器上测试的时候,可以把比值调低,比如0.49 
    3、或者简单粗暴把自我保护模式关闭

    eureka:
      server:
        enable-self-preservation: false

    二、Eureka 的自我保护模式详解


     

    访问Eureka主页时,如果看到这样一段大红色的句子:

    EMERGENCY! EUREKA MAY BE INCORRECTLY CLAIMING INSTANCES ARE UP WHEN THEY’RE NOT. RENEWALS ARE LESSER THAN THRESHOLD AND HENCE THE INSTANCES ARE NOT BEING EXPIRED JUST TO BE SAFE.

    那么就表明着Eureka的 自我保护模式(self-preservation mode) 被启动了,当 Eureka Server 节点在短时间内丢失了过多实例的连接时(比如网络故障或频繁的启动关闭客户端),那么这个节点就会进入自我保护模式,一旦进入到该模式,Eureka server 就会保护服务注册表中的信息,不再删除服务注册表中的数据(即不会注销任何微服务),当网络故障恢复后,该 Ereaka Server 节点就会自动退出自我保护模式(我的 Eureka Server 已经几个月了,至今未自动退出该模式)

    默认情况下,如果 Ereaka Server 在一段时间内没有接受到某个微服务示例的心跳,便会注销该实例(默认90秒),而一旦进入自我保护模式,那么即使你关闭了指定实例,仍然会发现该 Ereaka Server 的注册实例中会存在被关闭的实例信息,如果你对该实例做了负载均衡,那么仅关闭了其中一个实例,则通过网关调用接口api时很可能会发生如下异常:

    {
    "timestamp": 1507707671780,
    "status": 500,
    "error": "Internal Server Error",
    "exception": "com.netflix.zuul.exception.ZuulException",
    "message": "GENERAL"
    }



    解决这种情况的方法主要有几种方式:

    1. 等待 Eureka Server 自动恢复
    正常的情况下,等待网络恢复(或者没有频繁的启动与关闭实例)后,等待一段时间 Eureka Server 会自动关闭自我保护模式,但是如果它迟迟没有关闭该模式,那么便可以尝试手动关闭,如下。

    2. 重启 Eureka Server
    通常而言,PRD 环境建议对 Eureka Server 做负载均衡,这样在依次关闭并开启 Eureka Server 后,无效的实例会被清除,并且不会对正常的使用照成影响。

    3. 关闭 Eureka 的自我保护模式
    在yml配置文件中新增如下配置:

    eureka:
    server:
    enable-self-preservation: false
    eviction-interval-timer-in-ms: 4000 # This is not required


    从根源解决问题,但是并不推荐在PRD环境中使用,后面会说明。

    二、开发环境的 Eureka Server


     

    对于开发环境的 Eureka Server,个人更建议关闭它的自我保护模式,因为你可能需要不断的开启与关闭实例,如果并未关闭自我保护模式,那么很容易就会触发自我保护模式,此时对调试会相对比较麻烦。

    但是关闭自我保护模式,会有另外一个可能的问题,即隔一段时间后,可能会发生实例并未关闭,却无法通过网关访问了,此时很可能是由于网络问题,导致实例(或网关)与 Eureka Server 断开了连接,Eureka Server 已经将其注销(网络恢复后,实例并不会再次注册),此时重启 Eureka Server 节点或实例,并等待一小段时间即可。



  • 相关阅读:
    手动安装vue-devtools
    redis随记
    JS时间格式化
    360自动抢票还不够,几行js代码设置无人值守
    HttpWebRequest请求返回非200的时候 HttpWebResponse怎么接受返回错误提示
    android发编译
    asprise-ocr-api-sample 高价收破解版64 32位
    (16)集合操作
    (15)字典操作
    (14)字符串
  • 原文地址:https://www.cnblogs.com/xujingyang/p/11929468.html
Copyright © 2011-2022 走看看