首先介绍Snapshot
snapshot可以为volume创建快照,快照中保存了volume当前的状态,此后可以通过snapshot回溯
主要采用了Copy On Write算法。进行快照时,不牵涉到任何档案复制动作,它所作的只是通知服务器将目前有数据的磁盘区块全部保留起来,不被覆写。接下来档案修改或任何新增、删除动作,均不会覆写原本数据所在的磁盘区块,而是将修改部分写入其它可用的磁盘区块中。
COW技术在很多场景都有应用,下图为编程中创建子进程时采用COW技术的场景(思想一致):
只读情况:
针对上述场景,当父子进程中有更改相应段的行为发生时,再为子进程相应的段分配物理空间,如下:
写情况:
资源的复制只有在需要写入的时候才进行,此前,是以只读方式共享,使实际的拷贝被推迟到实际发生写入的时候。
再回到volume的snapshot中,根据上述其它场景的例子,此处的volume即对应上述的物理空间,而snapshot相当于指向虚拟空间的指针,是依赖于volume的,无法独立存在。
Backup相关
Backup与Snapshot区别
1. snapshot依赖源volume,不能独立存在;而backup不依赖vilume,即便源volume不存在了,仍可以restroe。
2. snapsot与源volume通常存放在一起,由同一个volume provider管理;backup存放在独立的备份设备中,有自己的备份方案和实现。
3. backup具有容灾功能;而snapshot则提供volume provider内便捷的回溯功能。
分析backup创建流程
以NFS为backend时:
1. 启动backup操作,mount NFS
2. 创建volume的临时快照
3. 创建存放backup的container目录
4. 对临时快照数据压缩并保存到container目录中
5. 创建保存sha256(加密)文件和metadata文件
6. 删除临时快照
以LVM为backend时:
1. 创建volume的临时快照
2. 创建一个设备new_lv
3. 依据快照将数据从源卷拷贝到new_lv中
4. 删除临时快照
以ceph为backend时:
1. 判断源卷是否为RBD卷,如果源卷为RBD卷,则使用增量备份,否则使用全量备份。
Ceph作为backend
按照cinder-volume所用的backend分两种情况介绍:一种是使用非RBD作为backend,另一种是使用RBD作为backend。
1. cinder-volume使用非RBD作为backend
这种情况下比较简单,并且仅支持全量备份。在创建备份时,首先创建一个base backup image,然后每次从源卷读入chunk_size(即backup_ceph_chunk_size,默认是128MB)大小的数据,写入到backup image,直到把整个源卷都复制完。注意,这里不支持对chunk的压缩。因为volume上的数据都会写入到创建的这个backup image上去,也就是说volume和backup是一对一的,因此也不需要metadata文件。
2. cinder-volume使用RBD作为backend
在这种情况下,即cinder-volume和cinder-backup都是用rbd作为backend,是支持增量备份的。增量备份的实现完全依赖于ceph处理差量文件的特性,所谓ceph处理差量文件的能力,即ceph可以将某个rbd image不同时刻的状态进行比较,并且将其差量导出成文件。另外,ceph也可以将这个差量文件导入到某个image中。
差量文件的生成与导入
生成差量文件的三种方式
三种方式对应命令及简要描述:
rdb export-diff volumes/image1 diff1 | image1创建时到此时的diff |
rbd export-diff volumes/image1@snap1 diff2 | image1创建时与snap1的diff |
rbd export-diff volumes/image1-from-snap snap1 diff3 |
image1此时(snap2)与snap1的diff |
导入差量文件的三种方式(前提,先创建一个image2,然后将diff文件导入image2):
rbd import-diff diff1 volumes/image2 | image2和生成diff1时的image1相同 |
rbd import-diff diff2 volumes/image2 | image2和创建snap1时的image1相同 |
rbd import-diff diff3 volumes/image2 | image2和创建snap1后(创建snap2时)的image1相同 |
备份的实现
依据上述差量文件的生成与导入的操作特性实现备份,这里主要说明ceph增量备份的实现:
备份的恢复
diff方式的恢复
利用ceph的特性,首先找到第一次备份时创建的base image和所选备份的snapshot,利用上述第二种生成差量文件的方式生成diff文件,将diff文件导入到新的volume即完成volume恢复。
1)获取恢复备份的起点
2)如果能则进行增量恢复
这里进行增量恢复的条件如下
a. 要恢复的卷必须是rbd
b. 要恢复的卷必须没有任何内容
c. 备份卷必须存在
d. 备份卷的恢复点(快照)必须存在
e. 要恢复的卷和备份卷的源卷是不同的
3)如果不能,则进行全量恢复
非diff方式的恢复
全量恢复,每次从备份读入chunk_size的数据,写入到对应的volume中,直到复制完整个备份。没有metadata文件,也不支持解压。