数据存储
容器的生命周期可能很短,会被频繁地创建和销毁。容器在销毁时,保存在容器中的数据也会被清除。这种结果对用户来说,在某些情况下是不乐意看到的。为了持久化保存容器的数据,kubernetes引入了Volume的概念。
Volume是Pod中能够被多个container访问的共享目录。它被定义在Pod上,然后被一个Pod里的多个容器挂载到具体的文件目录下。Kubernetes通过Volume实现:
- 同一个Pod中不同容器之间的数据共享
- 数据的持久化存储。
Volume的生命周期不与Pod中单个container的生命周期相关联。当container终止或重启时,Volume中的数据也不会丢失。
Kubernetes的Volume支持多种类型,常见的有:
- 简单存储:EmptyDir、HostPath、NFS
- 高级存储:PV、PVC
- 配置存储:ConfigMap、Secret
1. 基本存储
1.1. EmptyDir
最基础的Volume类型,一个EmptyDir就是Host上的一个空目录。
EmptyDir是在Pod分配到Node时创建的,它的初始内容为空,并且无需指定宿主机上对应的目录文件,因为kubernetes会自动分配一个目录。当Pod销毁时,EmptyDir中的数据也会被永久删除。EmptyDir用途为:
- 临时空间,例如用于某些应用程序运行时所需的临时目录,且无需永久保留
- 一个容器需要从另一个容器中获取数据的目录(多容器共享目录)
下面演示一个示例:在一个Pod中准备2个容器nginx和busybox,然后声明一个Volume分别挂在2个容器的目录中。Nginx负责向Volume中写日志,busybox中通过命令将日志内容读到控制台。
如下图所示:
创建volume-emptydir.yaml
$ cat yamls/volume-emptydir.yaml apiVersion: v1 kind: Pod metadata: name: volume-emptydir namespace: dev spec: containers: - name: nginx image: nginx:1.17.1 ports: - containerPort: 80 volumeMounts: - name: logs-volume mountPath: /var/log/nginx - name: busybox image: busybox:1.30 command: ["/bin/sh", "-c", "tail -f /logs/access.log"] volumeMounts: - name: logs-volume mountPath: /logs volumes: - name: logs-volume emptyDir: {}
$ cat yamls/volume-emptydir.yaml apiVersion: v1 # 访问一次nginx服务后,验证输出。volume-emptydir 为pod名,-c指定container $ kubectl logs -f volume-emptydir -n dev -c busybox 10.0.0.145 - - [02/Mar/2021:12:54:33 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.61.1" "-"
1.2. HostPath
EmptyDir中数据不会持久化,它会随着Pod的结束而销毁,如果想简单地将数据持久化到主机中,可以选择HostPath。
HostPath就是将Node主机中一个实际目录挂载到Pod中,以供Container使用。这样可以保证Pod在被销毁后,数据依然可以保存在Node中。
示例:
$ cat yamls/volume-hostpath.yaml apiVersion: v1 kind: Pod metadata: name: volume-hostpath namespace: dev spec: containers: - name: nginx image: nginx:1.17.1 ports: - containerPort: 80 volumeMounts: - name: logs-volume mountPath: /var/log/nginx - name: busybox image: busybox:1.30 command: ["/bin/sh", "-c", "tail -f /logs/access.log"] volumeMounts: - name: logs-volume mountPath: /logs volumes: - name: logs-volume hostPath: path: /root/logs type: DirectoryOrCreate
关于type类型的说明:
DirectoryOrCreate #目录存在就使用,不存在就先创建
Directory #目录必须存在
FileOrCreate #文件存在就使用,不存在就先创建
File #文件必须存在
Socket #unix套接字必须存在
CharDevice #字符设备必须存在
BlockDevice #块设备必须存在
1.3. NFS
HostPath可以解决数据持久化的问题,但是一旦Node节点故障后,Pod转移到其他节点,则又会出现问题。此时需要准备单独的网络存储系统,比较常用的是NFS、CIFS。
NFS是一个网络文件存储系统,可以搭建一台NFS服务器,然后将Pod中的存储直接连接到NFS系统上。这样无论Pod在节点上怎么转移,只要Node跟NFS的对接没问题,数据就能成功访问。
2. 高级存储
对于NFS存储,要求用户会搭建NFS系统,并且在yaml里配置nfs。由于kubernetes支持的存储系统有很多,要求客户全部掌握不太现实。为了能够屏蔽底层存储实现的细节,方便用户使用,kubernetes引入了PV和PVC两种资源对象。
PV(Persistent Volume)是持久化卷的意思,是对底层的共享存储的一种抽象。一般情况下PV由kubernetes管理员进行创建和配置,它与底层具体的共享存储技术有关,并通过插件完成与共享存储的对接。
PVC(Persistent Volume Claim)是持久卷声明的意思。是用户对于存储需求的一种声明。也就是说PVC是用户向kubernetes系统发出的一种资源需求申请。
如下图:
对于用户来说,只提存储需求(PVC),专业的具体存储配置细节(PV)由管理员完成。
使用了PV和PVC后,工作可以进一步细分:
- 存储:存储工程师维护
- PV:kubernetes管理员维护
- PVC:kubernetes用户维护
2.1. PV
PV是存储资源的抽象,资源清单如:
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv2
spec:
nfs: # 存储类型,与底层真正存储对应
capacity: # 存储能力,目前支持存储空间的设置
storage: 2Gi
accessModes: # 访问模式
storageClassName: # 存储类别
persistentVolumeReclaimPolicy: # 回收策略
PV的关键参数说明:
- 存储类型
- 底层实际存储的类型,kubernetes支持多种存储类型,每种存储类型的配置都有所差异
- 存储能力(capacity)
- 目前只支持存储空间的设置(storage=1Gi),不过未来可能会加入IOPS、吞吐量等指标
- 访问模式(accessModes)
-
用于描述用户应用对存储资源的访问权限,访问权限包括:
- ReadWriteOnce(RWO):读写权限,但只能被单个节点挂载
- ReadOnlyMany(ROX):只读权限,可以被多个节点挂载
- ReadWriteMany(RWX):读写权限,可以被多个节点挂载
-
- 回收策略(persistentVolumeReclaimPolicy)
- 当PV不再被使用后,对其的处理方式,目前支持3种策略:
- Retain(保留)保留数据,需要管理员手工清除数据
- Recycle(回收)清除PV中的数据,效果相当于执行rm -rf /thevolume/*
- Delete(删除)与PV相连的后端存储(例如NFS)完成volume的删除操作,常见于云厂商的存储服务
- 存储类别
- PV可以通过storageClassName参数指定一个存储类别
- 具有特定类别的PV只能与请求了该类别的PVC进行绑定
- 未设定类别的PV只能与不请求任何类别的PVC进行绑定
- 状态
- 一个PV的声明周期中,可能会处于4种不同的阶段:
- Available(可用):可用状态,还未被任何PVC绑定
- Bound(已绑定):表示PV已经被PVC绑定
- Released(已释放):表示PVC被删除,但是资源还未被集群重新声明
- Failed(失败):表示该PV的自动回收失败
下面以NFS作为底层存储进行示例:
# 安装 $ sudo yum install nfs-utils -y # 创建3个pv $ mkdir /tmp/data/{pv1,pv2,pv3} -pv mkdir: created directory ‘/tmp/data/pv1’ mkdir: created directory ‘/tmp/data/pv2’ mkdir: created directory ‘/tmp/data/pv3’ # 将共享目录以读写权限暴露给10.0.0.0/16 网段中所有主机 $ cat /etc/exports /tmp/data/pv1 10.0.0.0/16(rw,no_root_squash) /tmp/data/pv2 10.0.0.0/16(rw,no_root_squash) /tmp/data/pv3 10.0.0.0/16(rw,no_root_squash) # 重启 nfs 服务 $ sudo systemctl restart nfs
创建pv.yaml
$ cat yamls/pv.yaml apiVersion: v1 kind: PersistentVolume metadata: name: pv1 spec: capacity: storage: 1Gi accessModes: - ReadWriteMany persistentVolumeReclaimPolicy: Retain nfs: path: /tmp/data/pv1 server: 10.0.0.145 --- apiVersion: v1 kind: PersistentVolume metadata: name: pv2 spec: capacity: storage: 2Gi accessModes: - ReadWriteMany persistentVolumeReclaimPolicy: Retain nfs: path: /tmp/data/pv2 server: 10.0.0.145 --- apiVersion: v1 kind: PersistentVolume metadata: name: pv3 spec: capacity: storage: 3Gi accessModes: - ReadWriteMany persistentVolumeReclaimPolicy: Retain nfs: path: /tmp/data/pv3 server: 10.0.0.145
$ kubectl get pv -n dev
NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE
pv1 1Gi RWX Retain Available 11m
pv2 2Gi RWX Retain Available 11m
pv3 3Gi RWX Retain Available 11m
2.2. PVC
PVC 是资源的申请,用来声明对存储空间、访问模式、存储类别需求信息。下面是资源清单文件:
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc
namespace: dev
spec:
accessModes: # 访问模式
selector: # 采用标签对PV选择
storageClassName: # 存储类别
resources: # 请求空间
requests:
storage: 5Gi
PVC的关键配置参数说明:
- 访问模式(accessModes)
- 用于描述用户应用对存储资源的访问权限
- 选择条件(selector)
- 通过Label Selector的设置,可使PVC对于系统中已存在的PV进行筛选
- 存储类别(storageClassName)
- PVC在定义时可以设定需要的后端存储的类别,只有设置了该class的PV才能被系统选出
- 资源请求(Resources)
- 描述对存储资源的请求
- 描述对存储资源的请求
创建 pvc.yaml,申请pv,这里使用 AWS EKS为例。
对于 AWS EKS,可以使用EBS卷或是EFS作为存储,具体可以参考以下文档:
https://docs.aws.amazon.com/zh_cn/eks/latest/userguide/storage-classes.html
https://docs.aws.amazon.com/zh_cn/eks/latest/userguide/efs-csi.html
此处我们使用EFS:
#首先部署Amazon EFS CSI 驱动程序 $ kubectl apply -k "github.com/kubernetes-sigs/aws-efs-csi-driver/deploy/kubernetes/overlays/stable/?ref=release-1.0" # 创建efs,以及efs mount point,可参考: https://aws.amazon.com/premiumsupport/knowledge-center/eks-persistent-storage/ # 创建 efs pv $ cat specs/pv.yaml apiVersion: v1 kind: PersistentVolume metadata: name: efs-pv spec: capacity: storage: 1Gi volumeMode: Filesystem accessModes: - ReadWriteMany persistentVolumeReclaimPolicy: Retain storageClassName: efs-sc csi: driver: efs.csi.aws.com volumeHandle: fs-667ec9fb $ kubectl get pv NAME CAPACITY ACCESS MODES RECLAIM POLICY STATUS CLAIM STORAGECLASS REASON AGE efs-pv 1Gi RWX Retain Available efs-sc 35s # 创建 storage class $ cat specs/storageclass.yaml kind: StorageClass apiVersion: storage.k8s.io/v1 metadata: name: efs-sc provisioner: efs.csi.aws.com # 创建pvc $ cat yamls/pvc-efs.yaml apiVersion: v1 kind: PersistentVolumeClaim metadata: name: efs-claim namespace: dev spec: accessModes: - ReadWriteMany storageClassName: efs-sc resources: requests: storage: 1Gi # 自动绑定到pv $ kubectl get pvc -n dev NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE efs-claim Bound efs-pv 1Gi RWX efs-sc 15m
下面启动pod对volume进行写入
$ cat yamls/pv-pod1.yaml apiVersion: v1 kind: Pod metadata: name: app1 namespace: dev spec: containers: - name: app1 image: busybox command: ["/bin/sh"] args: ["-c", "while true; do echo $(date -u) >> /data/out1.txt; sleep 5; done"] volumeMounts: - name: persistent-storage mountPath: /data volumes: - name: persistent-storage persistentVolumeClaim: claimName: efs-claim $ kubectl get pods -n dev NAME READY STATUS RESTARTS AGE app1 1/1 Running 0 55s # 验证 $ kubectl exec -it app1 -n dev -- /bin/sh cat /data/out1.txt Mon Mar 8 04:17:44 UTC 2021 Mon Mar 8 04:17:49 UTC 2021
删除 pvc 后,pv的状态为 Released,此状态并不可用,无法用于新的pvc。
2.3. 生命周期
PVC 和 PV 是一一对应的,PV和PVC之间的相互作用遵循以下生命周期:
- 资源供应:管理员手动创建底层存储和PV
- 资源绑定:用户创建PVC,kubernetes负责根据PVC的声明去寻找PV并绑定。系统会根据PVC对存储资源的请求,在已存在的PV中选择一个满足条件的PV。
- 一旦找到,就绑定PV与PVC,用户应用即可使用此PVC
- 若是未找到,PVC则会无限期处于Pending 状态,直到出现一个符合要求的PV
- PV一旦绑定到某个PVC上,就会被此PVC独占,无法再与其他PVC绑定
- 资源使用:用户可以在pod中像volume一样使用pvc
- Pod使用Volume的定义,将PVC挂载到容器内的某个路径进行使用
- 资源释放:用户删除PVC后释放PV。此PV的状态会转为“Released”,但无法立即与其他PVC进行绑定。通过之前PVC写入的数据可能还被保留在存储设备上,只有在清除之后该PV才能再次被使用
- 资源回收:kubernetes根据PV设置的回收策略进行资源的回收。只有PV的存储空间完成回收,才能供新的PVC绑定和使用
生命周期如下图所示:
3. ConfigMap
ConfigMap是一种特殊的存储卷,主要作用是用于存储配置信息。
$ cat yamls/configmap.yaml apiVersion: v1 kind: ConfigMap metadata: name: configmap namespace: dev data: info: username:admin password:123456 $ kubectl get configmap -n dev NAME DATA AGE configmap 1 10s
接下来创建一个pod-configmap.yaml,将上面创建的configmap挂载进去。
$ cat yamls/pod-configmap.yaml apiVersion: v1 kind: Pod metadata: name: pod-configmap namespace: dev spec: containers: - name: nginx image: nginx:1.17.1 volumeMounts: # 将configmap挂载到目录 - name: config mountPath: /configmap/config volumes: # 引用configmap - name: config configMap: name: configmap $ kubectl get pod -n dev NAME READY STATUS RESTARTS AGE pod-configmap 1/1 Running 0 5s
验证:
$ kubectl exec -it pod-configmap -n dev -- /bin/sh # cd /configmap/config # ls info # cat info username:admin password:123456# # 可以看到映射已经成功,每个configmap都映射成了一个目录 # key --> 文件 value --> 配置文件中的内容 # 此时如果更新configmap的内容,容器中的值也会动态更新
4. Secret
在Kubernetes中,还存在一种与ConfigMap非常类似的对象,称为Secret对象。它主要用于存储敏感信息,例如密码、密钥、证书等。
# 首先使用base64对数据进行编码 $ echo -n 'admin' | base64 YWRtaW4= $ echo -n '123456' | base64 MTIzNDU2 # 编写secret.yaml $ cat yamls/secret.yaml apiVersion: v1 kind: Secret metadata: name: secret namespace: dev type: Opaque data: username: YWRtaW4= password: MTIzNDU2 $ kubectl get secret -n dev NAME TYPE DATA AGE default-token-lcqxm kubernetes.io/service-account-token 3 12d secret Opaque 2 31s
创建pod验证:
$ cat yamls/pod-secret.yaml apiVersion: v1 kind: Pod metadata: name: pod-secret namespace: dev spec: containers: - name: nginx image: nginx:1.17.1 volumeMounts: - name: config mountPath: /secret/config volumes: - name: config secret: secretName: secret $ kubectl get pods -n dev NAME READY STATUS RESTARTS AGE pod-secret 1/1 Running 0 96s # 进入pod验证 $ kubectl exec -it pod-secret -n dev -- /bin/sh # cd secret/config # ls password username # cat password 123456
至此,实现了通过secret 进行编码(仅是编码,并非加密)。