前言
只有光头才能变强。
文本已收录至我的GitHub仓库,欢迎Star:https://github.com/ZhongFuCheng3y/3y
回顾前面:
前面两篇已经讲解了为什么需要Docker这项技术,以及解释了Docker的基本概念/术语,使用Docker成功运行Tomcat~
在上篇也同样留下一个问题:我们知道Tomcat运行起来需要Java的支持,那么我们在DockerHub拉取下来的Tomcat镜像是不是也有Java环境呢?
所以,这篇主要来讲讲Docker镜像相关的知识点!
一、简单了解Dockerfile
Dockerfile是用来构建Docker镜像的文件,是由一系列命令和参数构成的脚本。
简单来说:Dockerfile是镜像的源码。
上一篇我们pull
了一份Tomcat
的镜像,我们也可以去看看它的Dockerfile长的什么样:
我们随便点进去一个看一下:
我们在Dockerfile的第一行就可以发现FROM openjdk:8-jre
,所以可以确定的是:在DockerHub拉取下来的Tomcat镜像一定有Java环境!
在这里我们先不说如何
阅读/编写
Dockerfile文件,先了解到Dockerfile是镜像的源码即可
简单来说:通过Dockerfile文件可以知道我们拉取下来的镜像究竟是怎么构建的。
二、解除镜像的疑惑
我们知道Docker Hub有很多常用的镜像,比如说Centos
。我们去pull
一个下来看看Docker中的Centos
长啥样:
我们可以发现的是:Tomcat
的SIZE竟然比Centos
还要大!但按我们常规的想法,Centos
的镜像可能是3或4GB(现在200M),Tomcat
的镜像可能就200M(现在400M)。这是为什么呢??
如果我们在pull
的时候观察得比较仔细的话,可以发现pull
会拉下很多层镜像:
完全pull
下来的之后,我们如果使用docker images
只能查看到最终的镜像:
如果我们使用docker images -a
命令的话,可以把中间层镜像都查出来:
- 理想效果:(在镜像列表里边除了tomcat和centos应该还夹杂着名为
<none>
的镜像) - 遗憾的是:博主一直没测出效果来,也就是我的镜像列表里没有
<none>
的镜像(怀疑是版本的问题,我的版本是Docker版本是18.09.1,Centos的版本是CentOS Linux release 7.3.1611 。如果知道具体原因的不妨在评论区下告诉我)
Emmm,我们可以使用history
命令来看看,可以发现Tomcat包含很多个镜像层
还可以发现一点:Dockerfile有多少条命令,那就有多少个镜像层(不信你数数)
说了那么多,就想让大家知道:我们拉取下来的镜像实际上是由很多中间层镜像组成的。
再结合我们上一篇Docker入门为什么可以这么简单?,在解决Tomcat启动时一直卡住问题时,能够发现的是,我们可以使用cd, ls
等基础命令,但无法使用vi
命令(需要我自己去下载)。
我们可以推断出,pull
下来的镜像由很多层镜像组成【这些镜像都是精简过的(甚至连vi
命令都不支持)】
- 因为
Tomcat
镜像要的基础环境比Centos
镜像要多,所以Tomcat
镜像的SIZE比Centos
要大
三、Docker镜像的特点
关于Docker镜像,有以下特点:
- 由
Dockerfile
生成 - 呈现层级结构
- 每层镜像包含:镜像文件以及镜像
json
元数据信息
图像来源:http://open.daocloud.io/allen-tan-docker-xi-lie-zhi-shen-ke-li-jie-docker-jing-xiang-da-xiao/
3.1镜像呈现层级结构
联合文件系统(UnionFS)是实现Docker镜像的技术基础。在Docker中一般使用是AUFS(Another Union File System或Advanced Multilayered Unification File System)【具体还是得看宿主机用的什么系统】。
在搜索中文资料的时候,常常会发现有类似的解释:
“AUFS是一种 Union FS, 简单来说就是“支持将不同目录挂载到同一个虚拟文件系统下的文件系统”, AUFS支持为每一个成员目录设定只读(Rreadonly)、读写(Readwrite)和写(Whiteout-able)权限。Union FS 可以将一个Readonly的Branch和一个Writeable的Branch联合在一起挂载在同一个文件系统下”。
看得我一头雾水....后来去官方文档介绍AUFS:
AUFS is a union filesystem, which means that it layers multiple directories on a single Linux host and presents them as a single directory. These directories are called branches in AUFS terminology, and layers in Docker terminology
说白了,还是可以理解成:Docker的镜像的基础是联合文件系统,它支持将文件系统中的修改信息作为一次提交,并层层叠加,外界看到的是最外层的镜像。(比如外界只看到Tomcat镜像,而中间叠加了很多层镜像)
(这里只是拿AUFS说明,Docker实际上支持很多存储驱动,比如还有devicemapper,overlay2(Ubuntu的14.04.4或更高版本,16.04或更高版本), overlay,zfs
3.1.1镜像继承(共享)
Docker镜像可以通过分层来进行继承。
例如,hello-world
的Dockerfile镜像FROM scratch
镜像,scratch
在Docker中是一个基础镜像
FROM scratch
COPY hello /
CMD ["/hello"]
Centos
的Dockerfile镜像也是FROM scratch
镜像:
FROM scratch
ADD centos-7-docker.tar.xz /
LABEL org.label-schema.schema-version="1.0"
org.label-schema.name="CentOS Base Image"
org.label-schema.vendor="CentOS"
org.label-schema.license="GPLv2"
org.label-schema.build-date="20181205"
CMD ["/bin/bash"]
那么Centos
镜像和hello-world
共享同一个基础镜像层scratch
,提高了存储效率。
再说个例子,比如我们有一个Centos
镜像,这个镜像大小是202M
。然后,我们基于Centos
镜像手动往里边添加一个Tomcat
(假设这个Tomcat的大小是300M
),生成一个镜像,总大小就是502M
了。
如果仅仅是单纯的累加这两个镜像的大小:202M+502M=704M
,但是由于镜像复用的存在,实际占用的磁盘空间大小是:202M+300M=502M
AUFS uses the Copy-on-Write (CoW) strategy to maximize storage efficiency and minimize overhead。
如果想要了解COW,不妨阅读我之前写过的文章:
3.2json文件
Docker每一层镜像的json
文件,都扮演着一个非常重要的角色,其主要的作用如下:
- 记录 Docker 镜像中与容器动态信息相关的内容
- 记录父子 Docker 镜像之间真实的差异关系
- 弥补 Docker 镜像内容的完整性与动态内容的缺失
Docker镜像的json
文件可以认为是镜像的元数据信息
最后
今天简单地聊了一下Docker镜像的一些细节,但没去深入了解,想要继续深入的同学还得通过官方文档等途径去学习哈。
参考资料:
- Allen 谈 Docker
- 官方文档介绍AUFS
- Docker核心实现技术(命名空间&控制组&联合文件系统&Linux网络虚拟化支持)
- Docker联合文件系统Union File System
乐于输出干货的Java技术公众号:Java3y。公众号内有200多篇原创技术文章、海量视频资源、精美脑图,不妨来关注一下!
觉得我的文章写得不错,不妨点一下赞!