前言
kubernetes官方默认给我们提供了很多addons,其中就包括了日志处理套件EFK,包括 Elasticsearch, Fluentd 和 Kibana三个组件。其中Elasticsearch是搜索引擎,负责存储日志并对外提供日志的查询功能;Fluentd是一个日志收集组件,负责收集集群中的日志、并发送给Elasticsearch;Kibana是一个图形化展示组件,负责从Elasticsearch中查询日志,并以适当的形式展示出来
部署EFK
-
下载对应的启动文件
$ cd /opt/k8s/work/efk $ for file in es-service.yaml es-statefulset.yaml fluentd-es-configmap.yaml fluentd-es-ds.yaml kibana-deployment.yaml kibana-service.yaml; do wget https://raw.githubusercontent.com/kubernetes/kubernetes/master/cluster/addons/fluentd-elasticsearch/$file done
-
Elasticsearch 以statefulset形式启动。对应的镜像中不包含Es的安全插件 X-Pack。因为es要求
vm.max_map_count
的值不能小于262144,所以对应的启动文件es-statefulset.yaml中有一个init container,在es容器启动前设置vm.max_map_count
。如果系统中这个值已经设置过,可以把这个init container相关的配置去掉,通过以下命令可以查看vm.max_map_count
的值$ more /proc/sys/vm/max_map_count
-
Storage es-statefulset.yaml启动文件中es的存储配置的是EmptyDir,所以在es重启时存储的数据会丢失,因此直接下载的文件只使用于测试,如果想在生产环境使用,要替换成永久存性的存储卷。
-
Fluentd 以DaemonSet形式启动,会在所有节点上启动一个pod,依据fluentd-es-configmap.yaml中的配置会读取kubelet、container的日志,发送给es。
-
此addon中启动文件,不要直接在生产环境中使用,如果想在生产环境中使用,推荐用 Helm来安装这些组件,对应的helm地址如下
-
-
修改启动文件中对应的镜像地址
启动文件中默认的镜像Registry是quay.io,国内无法直接下载,此处用微软的Registry代替
$ sed -i -e 's_quay.io_quay.azk8s.cn_' es-statefulset.yaml $ sed -i -e 's_quay.io_quay.azk8s.cn_' fluentd-es-ds.yaml
-
启动EFK
$ kubectl apply -f .
以上通过Kubernetes提供的EFK进行日志收集的部署就完成了。不过由于我在自己测试环境执行时由于资源限制,ES无法同时启动两个,而Kubernetes提供的这个ES镜像,至少需要两个组建成集群才能正常使用,所以,只能采用ES官方的镜像自己搭建EFK环境。
单节点ElasticSearch部署EFK
部署Elasticsearch
-
编辑启动文件
-
es配置文件
$ cat >docker.es.co-configmap.yaml<<EOF kind: ConfigMap apiVersion: v1 metadata: name: es-config-v7.6.1 namespace: kube-system labels: addonmanager.kubernetes.io/mode: Reconcile data: elasticsearch.yml: |- cluster.name: kubernetes-logging node.name: elasticsearch-logging-0 path.data: /data discovery.type: single-node network.host: 0.0.0.0 EOF
- discovery.type: single-node,代表对应的es是单节点集群
- network.host: 0.0.0.0 任意IP都可以访问
-
es启动文件
$ cat >docker.es.co-statefulset.yml<<EOF # Elasticsearch deployment itself apiVersion: apps/v1 kind: StatefulSet metadata: name: elasticsearch-logging namespace: kube-system labels: k8s-app: elasticsearch-logging version: v7.4.2 addonmanager.kubernetes.io/mode: Reconcile spec: serviceName: elasticsearch-logging replicas: 1 selector: matchLabels: k8s-app: elasticsearch-logging version: v7.4.2 template: metadata: labels: k8s-app: elasticsearch-logging version: v7.4.2 spec: #serviceAccountName: elasticsearch-logging containers: - image: elasticsearch:7.6.1 name: elasticsearch-logging #imagePullPolicy: Always resources: # need more cpu upon initialization, therefore burstable class limits: cpu: 1000m memory: 4Gi requests: cpu: 100m memory: 1Gi ports: - containerPort: 9200 name: db protocol: TCP - containerPort: 9300 name: transport protocol: TCP #livenessProbe: #tcpSocket: # port: transport #initialDelaySeconds: 5 #timeoutSeconds: 10 # readinessProbe: #tcpSocket: # port: transport #initialDelaySeconds: 5 #timeoutSeconds: 10 volumeMounts: - name: elasticsearch-logging mountPath: /data - name: config-volume mountPath: /usr/share/elasticsearch/config/elasticsearch.yml subPath: elasticsearch.yml env: - name: "NAMESPACE" valueFrom: fieldRef: fieldPath: metadata.namespace volumes: - name: elasticsearch-logging emptyDir: {} - name: config-volume configMap: name: es-config-v7.6.1 EOF
相比较kubernetes给我们提供的启动文件,此处主要做了两点改变
- 删除了权限相关部分,不需要进行服务发现组件集群了。
- 镜像文件换成了elasticsearch:7.6.1,是es官方发布在docker hub上的镜像
- 需要注意的是volumeMounts中通过subPath: elasticsearch.yml,单独挂载了一个文件到容器内的一个目录中,目录中其他的文件不受影响。在subPath功能提出之前,想要单独替换某个目录下的一个文件,需要比较复杂的处理,如把文件先挂载到其他地方,再通过启动脚本将文件复制或者链接到应用所用的实际配置目录下。
-
es service文件
$ cat >es-service.yaml<<EOF apiVersion: v1 kind: Service metadata: name: elasticsearch-logging namespace: kube-system labels: k8s-app: elasticsearch-logging kubernetes.io/cluster-service: "true" addonmanager.kubernetes.io/mode: Reconcile kubernetes.io/name: "Elasticsearch" spec: ports: - port: 9200 protocol: TCP targetPort: db selector: k8s-app: elasticsearch-logging EOF
-
-
启动服务
$ kubectl create -f docker.es.co-configmap.yaml $ kubectl create -f docker.es.co-statefulset.yml $ kubectl create -f es-service.yaml
部署fluentd服务
fluentd启动文件和kubernetes给我们提供的没有什么变化,我本地启动时唯一修改的地方是docker日志的目录。在默认情况下,docker日志采用json-file这个日志driver,存储在docker工作目录下的containers目录中,默认的工作目录是/var/lib/docker,所以默认的docker 日志目录是/var/lib/docker/containers,我自己的环境在安装docker时将工作目录修改成了/data/k8s/docker/data,所以需要修改启动中的挂载目录
-
编辑启动文件
-
DaemonSet文件
$ cat>fluentd-es-ds.yaml<<EOF apiVersion: v1 kind: ServiceAccount metadata: name: fluentd-es namespace: kube-system labels: k8s-app: fluentd-es addonmanager.kubernetes.io/mode: Reconcile --- kind: ClusterRole apiVersion: rbac.authorization.k8s.io/v1 metadata: name: fluentd-es labels: k8s-app: fluentd-es addonmanager.kubernetes.io/mode: Reconcile rules: - apiGroups: - "" resources: - "namespaces" - "pods" verbs: - "get" - "watch" - "list" --- kind: ClusterRoleBinding apiVersion: rbac.authorization.k8s.io/v1 metadata: name: fluentd-es labels: k8s-app: fluentd-es addonmanager.kubernetes.io/mode: Reconcile subjects: - kind: ServiceAccount name: fluentd-es namespace: kube-system apiGroup: "" roleRef: kind: ClusterRole name: fluentd-es apiGroup: "" --- apiVersion: apps/v1 kind: DaemonSet metadata: name: fluentd-es-v3.0.0 namespace: kube-system labels: k8s-app: fluentd-es version: v3.0.0 addonmanager.kubernetes.io/mode: Reconcile spec: selector: matchLabels: k8s-app: fluentd-es version: v3.0.0 template: metadata: labels: k8s-app: fluentd-es version: v3.0.0 # This annotation ensures that fluentd does not get evicted if the node # supports critical pod annotation based priority scheme. # Note that this does not guarantee admission on the nodes (#40573). annotations: seccomp.security.alpha.kubernetes.io/pod: 'docker/default' spec: priorityClassName: system-node-critical serviceAccountName: fluentd-es containers: - name: fluentd-es image: quay.azk8s.cn/fluentd_elasticsearch/fluentd:v3.0.0 env: - name: FLUENTD_ARGS value: --no-supervisor -q resources: limits: memory: 500Mi requests: cpu: 100m memory: 200Mi volumeMounts: - name: varlog mountPath: /var/log - name: varlibdockercontainers mountPath: /data/k8s/docker/data/containers readOnly: true - name: config-volume mountPath: /etc/fluent/config.d ports: - containerPort: 24231 name: prometheus protocol: TCP #livenessProbe: #tcpSocket: # port: prometheus #initialDelaySeconds: 5 #timeoutSeconds: 10 #readinessProbe: #tcpSocket: # port: prometheus #initialDelaySeconds: 5 #timeoutSeconds: 10 terminationGracePeriodSeconds: 30 volumes: - name: varlog hostPath: path: /var/log - name: varlibdockercontainers hostPath: path: /data/k8s/docker/data/containers - name: config-volume configMap: name: fluentd-es-config-v0.2.0 EOF
- 将对应的varlibdockercontainers挂载的hostPath修改成了/data/k8s/docker/data/containers,并且挂载到fluentd容器内的路径也要是/data/k8s/docker/data/containers,要保持一致
-
配置文件,因为配置文件和kubernetes给我们提供的没有做变更,此处不全部贴出,具体内容参考fluentd-es-configmap.yaml,此处只给出source部分的内容,来讲解下前一步为什么我们挂载到fluentd容器内的日志目录要和宿主机保持一致
... <source> @id fluentd-containers.log @type tail path /var/log/containers/*.log pos_file /var/log/es-containers.log.pos tag raw.kubernetes.* read_from_head true <parse> @type multi_format <pattern> format json time_key time time_format %Y-%m-%dT%H:%M:%S.%NZ </pattern> <pattern> format /^(?<time>.+) (?<stream>stdout|stderr) [^ ]* (?<log>.*)$/ time_format %Y-%m-%dT%H:%M:%S.%N%:z </pattern> </parse> </source> ...
这个source部分的配置中,fluentd并不是从我们挂载的容器中的docker日志目录直接拿数据的,而是从/var/log/containers目录下拉取日志数据的(/var/log/是我们将宿主机的/var/log目录挂载进去的),这个是因为,Kubernetes 的kubelet组件在/var/log/目录下创建了一个软链接,并且将pod名称,和container名称也放到这个软连接名称中了,例如
/var/log/containers/fluentd-es-v3.0.0-hvbw7_kube-system_fluentd-es-ef645a4009163b41d596b68d32dbcc921f032549fa168b630d10d0ea2f98eacb.log -> /var/log/pods/kube-system_fluentd-es-v3.0.0-hvbw7_c5269d8e-8543-470a-8599-8ae3a7242a46/fluentd-es/0.log
/var/log/pods/kube-system_fluentd-es-v3.0.0-hvbw7_c5269d8e-8543-470a-8599-8ae3a7242a46/fluentd-es/0.log -> /data/k8s/docker/data/containers/ef645a4009163b41d596b68d32dbcc921f032549fa168b630d10d0ea2f98eacb/ef645a4009163b41d596b68d32dbcc921f032549fa168b630d10d0ea2f98eacb-json.log
kubelet通过这样的链接,读取/var/log/containers下的日志,实际上就会读取到容器内的日志,因为链接的路径信息已经固定,所以在容器内的路径一定要和宿主机中保持一致。
这样做的好处也比较好理解,因为日志文件名称中包含了pod名称,命名空间等kubernetes的信息,在flutented中通过插件很容易就可将这些信息解析出来,便于使用者在kibana中对特定应用的日志进行检索过滤。
-
-
启动fluentd
$ kubectl create -f fluentd-es-configmap.yaml $ kubectl create -f fluentd-es-ds.yaml
部署kibana
-
编辑启动文件
-
deployment文件
cat >cat kibana-deployment.yaml<<EOF apiVersion: apps/v1 kind: Deployment metadata: name: kibana-logging namespace: kube-system labels: k8s-app: kibana-logging addonmanager.kubernetes.io/mode: Reconcile spec: replicas: 1 selector: matchLabels: k8s-app: kibana-logging template: metadata: labels: k8s-app: kibana-logging annotations: seccomp.security.alpha.kubernetes.io/pod: 'docker/default' spec: containers: - name: kibana-logging image: elastic/kibana:7.2.0 resources: # need more cpu upon initialization, therefore burstable class limits: cpu: 1000m requests: cpu: 100m env: - name: ELASTICSEARCH_HOSTS value: http://elasticsearch-logging:9200 - name: SERVER_NAME value: kibana-logging - name: SERVER_BASEPATH value: /api/v1/namespaces/kube-system/services/kibana-logging/proxy - name: SERVER_REWRITEBASEPATH value: "false" ports: - containerPort: 5601 name: ui protocol: TCP EOF
-
service文件
cat >kibana-service.yaml<<EOF apiVersion: v1 kind: Service metadata: name: kibana-logging namespace: kube-system labels: k8s-app: kibana-logging kubernetes.io/cluster-service: "true" addonmanager.kubernetes.io/mode: Reconcile kubernetes.io/name: "Kibana" spec: ports: - port: 5601 protocol: TCP targetPort: ui selector: k8s-app: kibana-logging EOF
-
-
启动kibana
$ kubectl create -f kibana-deployment.yaml $ kubectl create -f kibana-service.yaml
启动kubecrl proxy访问kibana
$ kubectl proxy --accept-hosts='^*$' --address=192.168.0.107
通过界面访问,在浏览器中输入 http://192.168.0.107:8001/api/v1/namespaces/kube-system/services/kibana-logging/proxy/
访问kibana。
初次访问需要先配置index pattern
稍等片刻,之后在Discover界面就可以查看相应的日志
可以看到,除了容器中的日志,还额外追加了许多kubernetes的信息。