一. 查看集群信息
[root@k8s-master01 ~]# kubectl cluster-info[root@k8s-master01 ~]# kubectl cluster-info dump 二. 查看各组件状态[root@k8s-master01 ~]# kubectl -s http://localhost:8080 get componentstatusesNAME STATUS MESSAGE ERRORcontroller-manager Healthy ok scheduler Healthy ok etcd-0 Healthy {"health":"true"} 或者[root@k8s-master01 ~]# kubectl -s http://172.16.60.220:8080 get componentstatusesNAME STATUS MESSAGE ERRORscheduler Healthy ok controller-manager Healthy ok etcd-0 Healthy {"health":"true"} 三. GET信息 1) 查看节点 (k8s-master01 对应的是 172.16.60.220的主机名)[root@k8s-master01 ~]# kubectl get node #将命令中的node变为nodes也是可以的NAME STATUS AGEk8s-node01 Ready 1dk8s-node02 Ready 1d [root@k8s-master01 ~]# kubectl -s http://k8s-master01:8080 get node #将命令中的node变为nodes也是可以的NAME STATUS AGEk8s-node01 Ready 1dk8s-node02 Ready 1d 2) 查看pods清单(查看pod ip地址,下面命令加上"-o wide")[root@k8s-master01 ~]# kubectl get pod #将pod变为pods也可以。如果有namespace,需要跟上"-n namespace名字" 或 "--all-namespaces" NAME READY STATUS RESTARTS AGEnginx-controller-d97wj 1/1 Running 0 1hnginx-controller-lf11n 1/1 Running 0 1htomcat-controller-35kzb 1/1 Running 0 18mtomcat-controller-lsph4 1/1 Running 0 18m [root@k8s-master01 ~]# kubectl -s http://k8s-master01:8080 get pod #将命令中的pod变为pods也是可以的NAME READY STATUS RESTARTS AGEnginx-controller-d97wj 1/1 Running 0 1hnginx-controller-lf11n 1/1 Running 0 1htomcat-controller-35kzb 1/1 Running 0 18mtomcat-controller-lsph4 1/1 Running 0 18m 3) 查看service清单[root@k8s-master01 ~]# kubectl get service #将命令中的service变为services也是可以的NAME CLUSTER-IP EXTERNAL-IP PORT(S) AGEkubernetes 172.16.0.1 <none> 443/TCP 1dnginx-service-clusterip 172.16.77.193 <none> 8001/TCP 1hnginx-service-nodeport 172.16.234.94 <nodes> 8000:32172/TCP 59mtomcat-service-clusterip 172.16.144.116 <none> 8801/TCP 14mtomcat-service-nodeport 172.16.183.234 <nodes> 8880:31960/TCP 11m [root@k8s-master01 ~]# kubectl -s http://172.16.60.220:8080 get service #将命令中的service变为services也是可以的NAME CLUSTER-IP EXTERNAL-IP PORT(S) AGEkubernetes 172.16.0.1 <none> 443/TCP 1dnginx-service-clusterip 172.16.77.193 <none> 8001/TCP 1hnginx-service-nodeport 172.16.234.94 <nodes> 8000:32172/TCP 1htomcat-service-clusterip 172.16.144.116 <none> 8801/TCP 17mtomcat-service-nodeport 172.16.183.234 <nodes> 8880:31960/TCP 14m 或者 (后面的sed表示 打印奇数行)[root@k8s-master01 ~]# kubectl get services -o json|grep '"name":'|sed -n '1~2p' "name": "kubernetes", "name": "nginx-service-clusterip", "name": "nginx-service-nodeport", "name": "tomcat-service-clusterip", "name": "tomcat-service-nodeport", 4) 查看replicationControllers清单 (同理可以将命令中的replicationControllers变为replicationController也是可以的)[root@k8s-master01 ~]# kubectl get replicationControllersNAME DESIRED CURRENT READY AGEnginx-controller 2 2 2 2htomcat-controller 2 2 2 1h [root@k8s-master01 ~]# kubectl -s http://172.16.60.220:8080 get replicationControllersNAME DESIRED CURRENT READY AGEnginx-controller 2 2 2 2htomcat-controller 2 2 2 1h 5) 查看rc和namespace[root@k8s-master01 ~]# kubectl get rc,namespaceNAME DESIRED CURRENT READY AGErc/nginx-controller 2 2 2 2hrc/tomcat-controller 2 2 2 1h NAME STATUS AGEns/default Active 1dns/kube-system Active 1d 6) 查看pod和svc(和service一样)[root@k8s-master01 ~]# kubectl get pods,svcNAME READY STATUS RESTARTS AGEpo/nginx-controller-d97wj 1/1 Running 0 2hpo/nginx-controller-lf11n 1/1 Running 0 2hpo/tomcat-controller-35kzb 1/1 Running 0 1hpo/tomcat-controller-lsph4 1/1 Running 0 1h NAME CLUSTER-IP EXTERNAL-IP PORT(S) AGEsvc/kubernetes 172.16.0.1 <none> 443/TCP 1dsvc/nginx-service-clusterip 172.16.77.193 <none> 8001/TCP 2hsvc/nginx-service-nodeport 172.16.234.94 <nodes> 8000:32172/TCP 2hsvc/tomcat-service-clusterip 172.16.144.116 <none> 8801/TCP 1hsvc/tomcat-service-nodeport 172.16.183.234 <nodes> 8880:31960/TCP 1h 7) 以jison格式输出pod的详细信息.[root@k8s-master01 ~]# kubectl get podsNAME READY STATUS RESTARTS AGEnginx-controller-d97wj 1/1 Running 0 2hnginx-controller-lf11n 1/1 Running 0 2htomcat-controller-35kzb 1/1 Running 0 1htomcat-controller-lsph4 1/1 Running 0 1h 注意下面命令中的pods的名称可以通过上面命令查看[root@k8s-master01 ~]# kubectl get po nginx-controller-d97wj -o json{ "apiVersion": "v1", "kind": "Pod", "metadata": { "annotations": {...................................... "hostIP": "172.16.60.222", "phase": "Running", "podIP": "192.168.100.2", "startTime": "2019-03-15T14:40:18Z" }} 还可以输出其它格式和方法(kubectl get -h查看帮助)[root@k8s-master01 ~]# kubectl get -h 8) 查看指定pod跑在哪个node上[root@k8s-master01 ~]# kubectl get po nginx-controller-d97wj -o wide NAME READY STATUS RESTARTS AGE IP NODEnginx-controller-d97wj 1/1 Running 0 2h 192.168.100.2 k8s-node02 9) 获取指定json或ymal格式的KEY数据,custom-columns=XXXXX(自定义列名):.status.hostIP(以“点开始”,然后写路径就可以)注意: 下面命令中的nginx-controller-d97wj是pod单元名称 (kubectl get pods 可以查看pods)[root@k8s-master01 ~]# kubectl get po nginx-controller-d97wj -o custom-columns=HOST-IP:.status.hostIP,POD-IP:.status.podIP HOST-IP POD-IP172.16.60.222 192.168.100.2 10) describe方法describe类似于get,同样用于获取resource的相关信息。不同的是,get获得的是更详细的resource个性的详细信息,describe获得的是resource集群相关的信息。describe命令同get类似,但是describe不支持-o选项,对于同一类型resource,describe输出的信息格式,内容域相同。 需要注意: 如果发现是查询某个resource的信息,使用get命令能够获取更加详尽的信息。但是如果想要查询某个resource的状态,如某个pod并不是在running状态,这时需要获取更详尽的状态信息时,就应该使用describe命令。 [root@k8s-master01 ~]# kubectl describe po nginx-controller-d97wjName: nginx-controller-d97wjNamespace: defaultNode: k8s-node02/172.16.60.222Start Time: Fri, 15 Mar 2019 22:40:18 +0800Labels: name=nginxStatus: RunningIP: 192.168.100.2Controllers: ReplicationController/nginx-controllerContainers: nginx: Container ID: docker://8ae4502b4e62120322de98aa532e653d3d2e058ffbb0b842e0f265621bebbe61 Image: 172.16.60.220:5000/nginx Image ID: docker-pullable://172.16.60.220:5000/nginx@sha256:7734a210432278817f8097acf2f72d20e2ccc7402a0509810c44b3a8bfe0094a Port: 80/TCP State: Running Started: Fri, 15 Mar 2019 22:40:19 +0800 Ready: True Restart Count: 0 Volume Mounts: <none> Environment Variables: <none>Conditions: Type Status Initialized True Ready True PodScheduled TrueNo volumes.QoS Class: BestEffortTolerations: <none>No events. 11) create创建kubectl命令用于根据文件或输入创建集群resource。如果已经定义了相应resource的yaml或son文件,直接kubectl create -f filename即可创建文件内定义的resource。也可以直接只用子命令[namespace/secret/configmap/serviceaccount]等直接创建相应的resource。从追踪和维护的角度出发,建议使用json或yaml的方式定义资源。 命令格式:# kubectl create -f 文件名 12) replace更新替换资源replace命令用于对已有资源进行更新、替换。如前面create中创建的nginx,当我们需要更新resource的一些属性的时候,如果修改副本数量,增加、修改label,更改image版本,修改端口等。都可以直接修改原yaml文件,然后执行replace命令。 需要注意: 名字不能被更更新。另外,如果是更新label,原有标签的pod将会与更新label后的rc断开联系,有新label的rc将会创建指定副本数的新的pod,但是默认并不会删除原来的pod。所以此时如果使用get po将会发现pod数翻倍,进一步check会发现原来的pod已经不会被新rc控制,此处只介绍命令不详谈此问题,好奇者可自行实验。 命令格式:# kubectl replace -f nginx-rc.yaml 13) patch如果一个容器已经在运行,这时需要对一些容器属性进行修改,又不想删除容器,或不方便通过replace的方式进行更新。kubernetes还提供了一种在容器运行时,直接对容器进行修改的方式,就是patch命令。 如创建pod的label是app=nginx-2,如果在运行过程中,需要把其label改为app=nginx-3。这个patch命令如下:[root@k8s-master01 ~]# kubectl patch pod nginx-controller-d97wj -p '{"metadata":{"labels":{"app":"nginx-3"}}}'"nginx-controller-d97wj" patched 14) editedit提供了另一种更新resource源的操作,通过edit能够灵活的在一个common的resource基础上,发展出更过的significant resource。例如,使用edit直接更新前面创建的pod的命令为:# kubectl edit po nginx-controller-d97wj 上面命令的效果等效于:# kubectl get po nginx-controller-d97wj -o yaml >> /tmp/nginx-tmp.yaml# vim /tmp/nginx-tmp.yaml // 这此文件里做一些修改# kubectl replace -f /tmp/nginx-tmp.yaml 15) Delete根据resource名或label删除resource。# kubectl delete -f nginx-rc.yaml# kubectl delete po nginx-controller-d97wj# kubectl delete po nginx-controller-lf11n 16) applyapply命令提供了比patch,edit等更严格的更新resource的方式。通过apply,用户可以将resource的configuration使用source control的方式维护在版本库中。每次有更新时,将配置文件push到server,然后使用kubectl apply将更新应用到resource。kubernetes会在引用更新前将当前配置文件中的配置同已经应用的配置做比较,并只更新更改的部分,而不会主动更改任何用户未指定的部分。 apply命令的使用方式同replace相同,不同的是,apply不会删除原有resource,然后创建新的。apply直接在原有resource的基础上进行更新。同时kubectl apply还会resource中添加一条注释,标记当前的apply。类似于git操作。 17) logslogs命令用于显示pod运行中,容器内程序输出到标准输出的内容。跟docker的logs命令类似。如果要获得tail -f 的方式,也可以使用-f选项。# kubectl logs nginx-controller-d97wj 18) rolling-updaterolling-update是一个非常重要的命令,对于已经部署并且正在运行的业务,rolling-update提供了不中断业务的更新方式。rolling-update每次起一个新的pod,等新pod完全起来后删除一个旧的pod,然后再起一个新的pod替换旧的pod,直到替换掉所有的pod。 rolling-update需要确保新的版本有不同的name,Version和label,否则会报错 。# kubectl rolling-update nginx-controller -f nginx-rc.yaml 如果在升级过程中,发现有问题还可以中途停止update,并回滚到前面版本# kubectl rolling-update nginx-controller --rollback rolling-update还有很多其他选项提供丰富的功能,如--update-period指定间隔周期,使用时可以使用-h查看help信息. 19) scale (注意下面的nginx-controller 是在nginx-rc.yaml文件中定义的name名称)scale用于程序在负载加重或缩小时副本进行扩容或缩小,如前面创建的nginx有两个副本,可以轻松的使用scale命令对副本数进行扩展或缩小。扩展副本数到4:# kubectl scale rc nginx-controller --replicas=4 重新缩减副本数到2:# kubectl scale rc nginx-controller --replicas=2 20) autoscalescale虽然能够很方便的对副本数进行扩展或缩小,但是仍然需要人工介入,不能实时自动的根据系统负载对副本数进行扩、缩。autoscale命令提供了自动根据pod负载对其副本进行扩缩的功能。 autoscale命令会给一个rc指定一个副本数的范围,在实际运行中根据pod中运行的程序的负载自动在指定的范围内对pod进行扩容或缩容。如前面创建的nginx,可以用如下命令指定副本范围在1~4# kubectl autoscale rc nginx-controller --min=1 --max=4 21) attachattach命令类似于docker的attach命令,可以直接查看容器中以daemon形式运行的进程的输出,效果类似于logs -f,退出查看使用ctrl-c。如果一个pod中有多个容器,要查看具体的某个容器的的输出,需要在pod名后使用-c containers name指定运行的容器。如下示例的命令为查看kube-system namespace中的kube-dns-v9-rcfuk pod中的skydns容器的输出。# kubectl attach kube-dns-v9-rcfuk -c skydns --namespace=kube-system 22) execexec命令同样类似于docker的exec命令,为在一个已经运行的容器中执行一条shell命令,如果一个pod容器中,有多个容器,需要使用-c选项指定容器。 23) run类似于docker的run命令,直接运行一个image。 24) cordon, drain, uncordon这三个命令是正式release的1.2新加入的命令,三个命令一起介绍,是因为三个命令配合使用可以实现节点的维护。在1.2之前,因为没有相应的命令支持,如果要维护一个节点,只能stop该节点上的kubelet将该节点退出集群,是集群不在将新的pod调度到该节点上。如果该节点上本生就没有pod在运行,则不会对业务有任何影响。如果该节点上有pod正在运行,kubelet停止后,master会发现该节点不可达,而将该节点标记为notReady状态,不会将新的节点调度到该节点上。同时,会在其他节点上创建新的pod替换该节点上的pod。这种方式虽然能够保证集群的健壮性,但是任然有些暴力,如果业务只有一个副本,而且该副本正好运行在被维护节点上的话,可能仍然会造成业务的短暂中断。 1.2中新加入的这3个命令可以保证维护节点时,平滑的将被维护节点上的业务迁移到其他节点上,保证业务不受影响。如下图所示是一个整个的节点维护的流程(为了方便demo增加了一些查看节点信息的操作):1- 首先查看当前集群所有节点状态,可以看到共四个节点都处于ready状态;2- 查看当前nginx两个副本分别运行在d-node1和k-node2两个节点上;3- 使用cordon命令将d-node1标记为不可调度;4- 再使用kubectl get nodes查看节点状态,发现d-node1虽然还处于Ready状态,但是同时还被禁能了调度,这意味着新的pod将不会被调度到d-node1上。5- 再查看nginx状态,没有任何变化,两个副本仍运行在d-node1和k-node2上;6- 执行drain命令,将运行在d-node1上运行的pod平滑的赶到其他节点上;7- 再查看nginx的状态发现,d-node1上的副本已经被迁移到k-node1上;这时候就可以对d-node1进行一些节点维护的操作,如升级内核,升级Docker等;8- 节点维护完后,使用uncordon命令解锁d-node1,使其重新变得可调度;8)检查节点状态,发现d-node1重新变回Ready状态 # kubectl get nodes# kubectl get po -o wide# kubectl cordon d-node1# kubectl get nodes# kubectl get po -o wide# kubectl drain d-node1# kubectl get po -o wide# kubectl uncordon# kubectl uncordon d-node1# kubectl get nodes 25) 查看某个pod重启次数(这个是参考)# kubectl get pod nginx-controller-d97wj --template="{{range .status.containerStatuses}}{{.name}}:{{.restartCount}}{{end}}" 26) 查看pod生命周期[root@k8s-master01 ~]# kubectl get pod nginx-controller-d97wj --template="{{.status.phase}}"Running =============================================================================================== 常用命令-----------------------------------------------------------------kubectl get podskubectl get rckubectl get servicekubectl get componentstatuseskubectl get endpointskubectl cluster-infokubectl create -f redis-master-controller.yamlkubectl delete -f redis-master-controller.yamlkubectl delete pod nginx-772aikubectl logs -f pods/heapster-xxxxx -n kube-system #查看日志kubectl scale rc redis-slave --replicas=3 #修改RC的副本数量,来实现Pod的动态缩放etcdctl cluster-health #检查网络集群健康状态etcdctl --endpoints=http://172.16.60.220:2379 cluster-health #带有安全认证检查网络集群健康状态etcdctl member listetcdctl set /k8s/network/config '{ "Network": "10.1.0.0/16" }'etcdctl get /k8s/network/config 基础进阶---------------------------------------------------------------kubectl get services kubernetes-dashboard -n kube-system #查看所有servicekubectl get deployment kubernetes-dashboard -n kube-system #查看所有发布kubectl get pods --all-namespaces #查看所有podkubectl get pods -o wide --all-namespaces #查看所有pod的IP及节点kubectl get pods -n kube-system | grep dashboardkubectl describe service/kubernetes-dashboard --namespace="kube-system"kubectl describe pods/kubernetes-dashboard-349859023-g6q8c --namespace="kube-system" #指定类型查看kubectl describe pod nginx-772ai #查看pod详细信息kubectl scale rc nginx --replicas=5 #动态伸缩kubectl scale deployment redis-slave --replicas=5 #动态伸缩kubectl scale --replicas=2 -f redis-slave-deployment.yaml #动态伸缩kubectl exec -it tomcat-controller-35kzb /bin/bash #进入容器kubectl label nodes k8s-node01 zone=north #增加节点lable值 spec.nodeSelector: zone: north, 指定pod在哪个节点kubectl get nodes -lzone #获取zone的节点kubectl label pod tomcat-controller-35kzb role=master #增加lable值 [key]=[value]kubectl label pod tomcat-controller-35kzb role- #删除lable值kubectl label pod tomcat-controller-35kzb role=backend --overwrite #修改lable值kubectl rolling-update redis-master -f redis-master-controller-v2.yaml #配置文件滚动升级kubectl rolling-update redis-master --image=redis-master:2.0 #命令升级kubectl rolling-update redis-master --image=redis-master:1.0 --rollback #pod版本回滚yaml使用及命令----------------------------------------------------------kubectl create -f nginx-deployment.yaml #创建deployment资源kubectl get deploy #查看deploymentkubectl get rs #查看ReplicaSetkubectl get pods --show-labels #查看pods所有标签。可以添加"-all-namespaces" 或者 "-n kube-system"表示查看所有命名空间或某一命名空间里pods的标签kubectl get pods -l app=nginx #根据标签查看podskubectl set image deployment/nginx-deployment nginx=nginx:1.11 #滚动更新镜像或者kubectl edit deployment/nginx-deployment或者kubectl apply -f nginx-deployment.yaml #也表示对yaml修改后进行更新操作,更新到kubernetes集群配置中kubectl rollout status deployment/nginx-deployment #实时观察发布状态:kubectl rollout history deployment/nginx-deployment #查看deployment历史修订版本kubectl rollout history deployment/nginx-deployment --revision=3kubectl rollout undo deployment/nginx-deployment #回滚到以前版本kubectl rollout undo deployment/nginx-deployment --to-revision=3kubectl scale deployment nginx-deployment --replicas=10 #扩容deployment的Pod副本数量kubectl autoscale deployment nginx-deployment --min=10 --max=15 --cpu-percent=80 #设置启动扩容/缩容命名空间----------------------------------------------------------------kubectl get namespace #获取k8s的命名空间kubectl get pod --namespace =[命令空间名称] #获取对应命名空间内的pod,"--namespace"可以写成"-c"kubectl --namespace [命令空间名称] logs [pod名称] -c 容器名称 #获取对应namespace中对应pod的日志,如果不加"-c 容器名称",则默认查看的是该pod下第一个容器的日志pod维护示例:查看某个命令空间下的pod# kubectl get pods -n namespace 在没有pod 的yaml文件时,强制重启某个pod# kubectl get pod podname -n namespace -o yaml | kubectl replace --force -f - 查看某个pod重启次数(这个是参考)# kubectl get pod podname -n namespace --template="{{range .status.containerStatuses}}{{.name}}:{{.restartCount}}{{end}}" 查看pod生命周期# kubectl get pod podname --template="{{.status.phase}}" 查看kube-space命令空间下的pod[root@m7-autocv-gpu01 ~]# kubectl get pods -n kube-system -o wide|grep -E 'elasticsearch|fluentd|kibana'elasticsearch-logging-0 1/1 Running 0 5h9m 172.30.104.6 m7-autocv-gpu03 <none>elasticsearch-logging-1 1/1 Running 0 4h59m 172.30.232.8 m7-autocv-gpu02 <none>fluentd-es-v2.2.0-mkkcf 1/1 Running 0 5h9m 172.30.104.7 m7-autocv-gpu03 <none>kibana-logging-f6fc77549-nlxfg 1/1 Running 0 42s 172.30.96.7 m7-autocv-gpu01 <none> [root@m7-autocv-gpu01 ~]# kubectl get pod kibana-logging-f6fc77549-nlxfg -n kube-system -o yaml | kubectl replace --force -f -pod "kibana-logging-f6fc77549-d47nc" deletedpod/kibana-logging-f6fc77549-d47nc replaced [root@m7-autocv-gpu01 ~]# kubectl get pod kibana-logging-f6fc77549-nlxfg -n kube-system --template="{{range .status.containerStatuses}}{{.name}}:{{.restartCount}}{{end}}"kibana-logging:0 [root@m7-autocv-gpu01 ~]# kubectl get pod kibana-logging-f6fc77549-nlxfg -n kube-system --template="{{.status.phase}}"Running