zoukankan      html  css  js  c++  java
  • Docker存储驱动之ZFS简介

    ZFS是下一代的文件系统,支持了很多存储高级特性,如卷管理、快照、和校验、压缩和重复删除技术、拷贝等。
      ZFS由Sun公司创建,现属于Oracle,ZFS是开源的,并基于CDDL license。因为CDDL和GPL不兼容,ZFS不能加入Linux kernel主线。然而,ZFS On Linux(ZoL)项目提供kernel模块和用户空间程序,这些都可以单独的安装。
      ZFS on Linux(ZoL)是一项成熟的技术,但是,现在却不建议在产品中使用zfs存储驱动,当然,除非你对ZoL有着丰富的经验。
      注意:在Linux平台上,有ZFS的FUSE实现,它可以和Docker结合起来使用,但是却不推荐这样使用。原生的ZFS驱动(ZoL)被测试得更多,更有效率,也更广泛地被使用。下面的内容也指的是原生的ZFS驱动。

    镜像分层和共享

      Docker的zfs存储驱动使用了ZFS驱动的三个组件:
       ●文件系统
       ●快照
       ●克隆
      ZFS系统提供超配特性,通过按需分配操作从ZFS池(zpool)分配空间。快照和克隆是ZFS系统某个时间点的拷贝,较节省空间。快照是只读的,而克隆是读写的,克隆只能通过快照来创建。下图显示了它们之间这种简单地关系。
      
      图中的实线显示了创建了克隆的过程。第一步创建了一个文件系统的快照,第二步通过快照创建了一份克隆。虚线显示了克隆、文件系统和快照之间的关系。这三个ZFS组件都从同一个下层的zpool申请空间。
      在Docker host上使用zfs存储驱动。镜像的基础层就是一个ZFS文件系统,每个子层都是底层ZFS快照的一个ZFS克隆,容器就是一个ZFS克隆,它基于其镜像最顶层的ZFS快照。所有的ZFS组件都从同一个zpool分配空间。下图显示了一个基于两层镜像的容器是如何使用这些ZFS组件的。
      
      结合上图,下面的过程解释了镜像是如何分层的,容器是如何创建的。
       ▶在Docker host中,镜像的基础层是一个ZFS文件系统。
       文件系统从zpool中消耗空间。
       ▶附加的镜像层是其下层镜像的克隆。
       图中,“Layer 1”是通过创建基础镜像的ZFS快照,然后再通过快照创建克隆来实现的。克隆是可读写的,并且从zpool按需分配空间;而快照是只读的。
       ▶当容器启动时,就会在镜像层上附加一个可读写层。
       上图中,制造了一个镜像顶层的快照,然后再基于快照创建了一份克隆,而这份克隆就是容器的可读写层。
       如果需要改变容器,那么久会从zpool按需分配空间给容器,ZFS默认会分配128K大小的块。
      这种从只读快照创建子层和容器的方法,使得镜像作为不可变对象来维护。

    容器使用ZFS读写

      容器从zfs存储驱动读数据的过程非常简单。新启动的容器基于ZFS克隆,这份克隆从初始化开始就共享它底层的所有数据。这意味着使用zfs的读操作非常快,即使正在读的数据并没有拷贝到容器。下图显示了数据块的共享情况。
      
      写新数据是通过按需分配操作来完成的。每次要向容器的一个新区域写数据时,就会从zpool中分配一个新块,也就是说写新数据时容器就会消耗额外的空间。分配给容器的新空间从底层的zpool分配。
      想更新容器的新数据,就得分配新空间给容器,并将这些改变的信息保存在新的块中。原来的块没有改变,下面的镜像依然是不可变的。

    Docker中配置ZFS存储驱动

      只有在/var/lib/docker被映射在一个ZFS文件系统上时,才能在docker host上使用zfs存储驱动。本节将介绍如何在Ubuntu上安装原生的ZFS on Linux(ZoL)。

    准备

      如果你已经在Docker host上使用过Docker daemon,并且有一些想保存的镜像,那么在执行下面的步骤之前,你需要将这些镜像保存到Docker Hub或者你的私有Docker镜像仓库中。
      停止Docker daemon。另外,确保你在/dev/xvdb(这个设备名可能根据你的OS环境而不同,你需要换成适合你自己的设备名)上有一个空闲块设备。

    在Ubuntu16.04 LTS上安装ZFS

      1) 停止Docker daemon。

    $ sudo systemctl stop docker.service

      2) 安装zfs包。

     $ sudo apt-get install -y zfs
    
     Reading package lists... Done
     Building dependency tree
     <output truncated>

      3) 确认你的zfs模块成功安装并加载。

    $ lsmod | grep zfs
    
     zfs                  2813952  3
     zunicode              331776  1 zfs
     zcommon                57344  1 zfs
     znvpair                90112  2 zfs,zcommon
     spl                   102400  3 zfs,zcommon,znvpair
     zavl                   16384  1 zfs

    在Ubuntu 14.04 LTS上安装ZFS

      1) 停止Docker daemon。

    $ sudo systemctl stop docker.service

      2) 安装software-properties-common包。

    $ sudo apt-get install -y software-properties-common
    
    Reading package lists... Done
    Building dependency tree
    <output truncated>

      3) 添加zfs-native包。

    $ sudo add-apt-repository ppa:zfs-native/stable
    
    The native ZFS filesystem for Linux. Install the ubuntu-zfs package.
    <output truncated>
    gpg: key F6B0FC61: public key "Launchpad PPA for Native ZFS for Linux" imported
    gpg: Total number processed: 1
    gpg:               imported: 1  (RSA: 1)
    OK

      4) 获取最新包的列表。

     $ sudo apt-get update
    
     Ign http://us-west-2.ec2.archive.ubuntu.com trusty InRelease
     Get:1 http://us-west-2.ec2.archive.ubuntu.com trusty-updates InRelease [64.4 kB]
     <output truncated>
     Fetched 10.3 MB in 4s (2,370 kB/s)
     Reading package lists... Done

      5) 安装ubuntu-zfs包。

    $ sudo apt-get install -y ubuntu-zfs
    
    Reading package lists... Done
    Building dependency tree
    <output truncated>

      6) 加载zfs模块。

    $ sudo modprobe zfs

      7) 确认模块是否正确加载。

    $ lsmod | grep zfs
    
    zfs                  2768247  0
    zunicode              331170  1 zfs
    zcommon                55411  1 zfs
    znvpair                89086  2 zfs,zcommon
    spl                    96378  3 zfs,zcommon,znvpair
    zavl                   15236  1 zfs

    在Docker中配置ZFS

      一旦安装和加载了ZFS,就可以在Docker中配置ZFS了。
       1) 创建一个新的zpool。

    $ sudo zpool create -f zpool-docker /dev/xvdb

       上面命令创建了一个名为“zpool-docker”的zpool。这个名称是随意的。
       2) 检查zpool是否存在。

    $ sudo zfs list
    
    NAME            USED  AVAIL    REFER  MOUNTPOINT
    zpool-docker    55K   3.84G    19K    /zpool-docker

       3) 在/var/lib/docker上创建和映射一个新的ZFS文件系统。

    $ sudo zfs create -o mountpoint=/var/lib/docker zpool-docker/docker

       4) 检查前面的步骤是否正常工作。

    $ sudo zfs list -t all
    
    NAME                 USED  AVAIL  REFER  MOUNTPOINT
    zpool-docker         93.K  3.4G    9K  /zpool-docker
    zpool-docker/docker  9K    3.4G    9K  /var/lib/docker

       可以看到,在/var/lib/docker上映射了一个ZFS文件系统,daemon启动后会自动加载zfs存储驱动。
       5) 启动Docker daemon。

    $ sudo service docker start
    
    docker start/running, process 2315

       6) 确认daemon正在使用zfs存储驱动。

    $ sudo docker info
    
    Containers: 0
    Images: 0
    Storage Driver: zfs
        Zpool: zpool-docker
        Zpool Health: ONLINE
        Parent Dataset: zpool-docker/docker
        Space Used By Parent: 27648
        Space Available: 4128139776
        Parent Quota: no
        Compression: off
        Execution Driver: native-0.2
    [...]

    Docker中的ZFS性能

      有以下一些因素会影响zfs存储驱动在Docker中的性能。
       ●内存。内存对ZFS性能影响很大,因为ZFS最初被设计成在拥有大量内存的Sun Solaris服务器上使用的。
       ●ZFS特性。使用ZFS特性,如重复删除技术,会增加ZFS的内存使用。就内存使用和效率原因而言,建议关闭FS的重复删除特性。
       ●ZFS缓存。ZFS将磁盘块缓存在被称作adaptive replacement cache(ARC)内存结构体中。ZFS的ARC单拷贝特性使得块的单个缓存拷贝可以被多个文件系统的克隆共享,也就是说多个运行着的容器可以共享缓存块的单个拷贝。这意味着对于PaaS或其他高密度用例来说,ZFS是一个不错的选择。
       ●存储碎片。碎片是诸如ZFS这种copy-on-write文件系统的副产品。不过,ZFS写128K的块时,会分配slab(多个128K的块)来进行CoW操作,从而尝试减少存储碎片。ZFS intent log(ZIL)和 coalescing of writes(delayed writes)也可以帮忙减少碎片。
       ●使用原生的Linux ZFS驱动。虽然Docker zfs存储驱动支持ZFS FUSE实现,但在高性能场景下不建议使用ZFS FUSE。原生的ZFS Linux驱动有着更好的性能。
       ●使用SSD。为了更好的性能,可以使用更快的存储介质(如SSD)。不过,如果你的SSD存储很有限,那么建议你关闭SSD上的ZIL特性。

    限制容器写的存储配额

      如果你像实现对每个镜像的存储配额,那么你可以使用--storage-opt选项。

    --storage-opt size=256M

      它会限制容器可以写/修改的空间大小(需要ZFS使能特性available)。也就是说,如果你有一个256MB大小的镜像,并且使用了前面的参数选项,那么你对应的容器就有512MB的大小,其中有256MB是可用的。

  • 相关阅读:
    C++如何对接sqlitepp
    c++11中的condition_variable和之前的pthread_cond_timedwait的不同之处
    浏览器设置代理模式后的报文是怎么样的?
    C++11中令人吐血的"移动语义"和"新的右值引用"
    MYSQL的事务及锁操作
    Microsoft Word —— 使用宏脚本将所有表格添加边框
    Navicat——如何导出数据字典
    Redis——配置详解
    keepalived——tengine集群主备均有VIP
    Docker——如何修改运行中容器的映射端口
  • 原文地址:https://www.cnblogs.com/wuyuxin/p/7041371.html
Copyright © 2011-2022 走看看