zoukankan      html  css  js  c++  java
  • k8s节点NotReady问题处理

    我把三台虚拟机重启,发现2个节点一直处于NotReady状态,便去查找问题,到最后是因为子节点的kubelet的状态异常了,restart一下就好了,下面转一下解决的思路


    昨天晚上,针对K8S环境做了一次压测,50路并发实施,早上起来看监控,发现昨晚8点之后,系统好像都宕掉了,一看master节点和一个node节点状态变成了not ready,主要定位手段如下:

    1. 查看master kubelet状态

    systemctl status kubelet 状态正常

    2. 查看master kube-proxy状态

    systemctl status kube-proxy  状态正常

    3. 查看master kube-apiserver状态

    systemctl status kube-apiserver  状态正常

    4. 查看master kube-scheduler状态

    systemctl status kube-scheduler  状态正常

    5. 查看master etcd状态

    systemctl status etcd  状态正常

    6. 查看flannel状态

    在kubernetes-dashboard上看到flannel挂掉了,查看日志如下

    Failed create pod sandbox: rpc error: code = Unknown desc = failed to start sandbox container for pod "kube-flannel-ds-amd64-sc7sr": Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "process_linux.go:301: running exec setns process for init caused "signal: broken pipe"": unknown

    而这个问题,通过分析应该是flannel在网络比较大的情况下,内存资源不足了,所以修改flannel的配置,将内存扩大即可。

    "resources": {
    "limits": {
    "cpu": "300m",
    "memory": "200Mi"
    },
    "requests": {
    "cpu": "300m",
    "memory": "200Mi"
    }
    },

    修改完成之后,需要重启docker,在删除原来的flannel pod,这样问题就解决拉
    原文链接:https://blog.csdn.net/Viogs/article/details/96114776

  • 相关阅读:
    APIO dispatching
    奶牛抗议
    擦弹
    逃跑
    [Hnoi2016]网络
    [Ahoi2005]LANE 航线规划
    素数密度_NOI导刊2011提高(04)
    P2939 [USACO09FEB]改造路Revamping Trails(分层图最短路)
    洛谷P3396 哈希冲突(分块)
    洛谷P4332 [SHOI2014]三叉神经树(LCT)
  • 原文地址:https://www.cnblogs.com/dalianpai/p/12060227.html
Copyright © 2011-2022 走看看