zoukankan      html  css  js  c++  java
  • nginx假死导致的问题回顾

    背景:

     网络大致拓扑型

    定位到一台Nginx节点于凌晨Timewait异常,等到6K。

    进程异常,ngx_http_realtime_request模块错误

    错误日志:

    2017/02/24 00:01:02 [alert] 25911#0: worker process 24588 exited on signal 11
    2017/02/24 00:01:02 [alert] 25911#0: shared memory zone "http_realtime_request_zone" was locked by 24588
    2017/02/24 00:01:02 [alert] 25911#0: worker process 24589 exited on signal 11
    2017/02/24 00:01:02 [alert] 25911#0: shared memory zone "http_realtime_request_zone" was locked by 24589

    解决过程:

    Nginx每天凌晨定时切割日志reload后,进程异常,但端口存活,致使F5仍旧分发请求,以及监控无法异常告警。

    1. 从github上查找项目https://github.com/magicbear/ngx_realtime_request_module

    发现最近更新是4年前,项目不活跃。

    2.网上有报过这个问题:http://code.taobao.org/pipermail/tengine-cn/2014-June/001406.html

    >>>> 2014-06-30 12:17 GMT+08:00 赵海军 <zhaohaijun在cmcm.com>:
    >>>>> 那这个问题应该是ngx_http_realtime_request导致的,请问有什么解决办法吗?
    >>>>>>> 这个看起来像是模块实现时的问题。需要这个模块的开发者来帮助排查,可以尝试再他的github上提个issue。
    >> BTW,我粗略看了下他的模块,这个问题可能和ngx_http_realtime_request_init_zone()实现有关系。
    >> *这里*ngx_http_realtime_request_init_zone()实现上是不太完善的
    >>

    3. 关闭ngx_http_realtime_request模块,重新reload

    4.增加timewait 监控

    5. 用elk监控nginx的流量,替换ngx_http_realtime_request功能

  • 相关阅读:
    oracle10G/11G官方迅雷下载地址合集(转载)
    Oracle数据库的登录以及常用数据导入查询
    Tomcat添加SSL网站证书配置
    SVN的安装与在IDEA中的配置
    01-Spring Boot配置文件详解
    微服务概况及注册中心搭建
    zk实现分布式锁
    ZooKeeper初识
    Reids集群知识
    redis初识
  • 原文地址:https://www.cnblogs.com/davidwang456/p/6474168.html
Copyright © 2011-2022 走看看