zoukankan      html  css  js  c++  java
  • 记一次nginx -t非常慢的排障经历

    在一次修改nginx配置时候,执行
    case:
    #/usr/local/nginx/sbin/nginx -t
    出现执行命令出现很久没返回结果,也没返回成功或是失败,就是一直卡住的状态,严重影响nginx配置文件修改。
    -t            : test configuration and exit   //-t就是检查nginx配置检查。
    出现此问题之后,开始着手排查原因。
     
    solution:
    于是用ps-ef获取到改进程的pid,想知道这个进程到底在哪一步耗时
    ps -ef |grep nginx
    拿到pid是3911。
    #strace -o output.txt -T -tt -e trace=all -p 3911     //strace命令查看每一步执行的时间开销
     
     
     
    发现大量fd=5的文件描述符出现了timeout。
     
    于是进一步查看fd=5 且进程号为3911的操作,到底在干吗:
    原来是这一步操作耗时由5s之久,
    进一步排查发现,该步操作是用UDP协议,请求的是系统的domain服务(即DNS服务)
    仔细查看系统/etc/resolv.conf 配置,发现dns的第一个nameserver 真的是10.1.1.172。
    后经确认,此nameserver的所在主机出现故障,还没维护好。
    至此,完成了一次完整的排障经历。
     
    关键点在于:
    1、善于用strace定位问题;
    2、理解fd(file description) 文件描述符的含义;
    3、思考总结
  • 相关阅读:
    python 登录与注册
    python 深浅拷贝
    列表|字典|集合推导式
    正则表达式——笔记
    Python thread
    allure报告自定义logo和名称
    回归测试用例编写思路
    测试用例规范【如何编写测试用例】
    git与pycharm的使用详解(git+gitlab+pycham)
    接口自动化
  • 原文地址:https://www.cnblogs.com/able7/p/10103552.html
Copyright © 2011-2022 走看看