前言:镜像的定制实际上就是定制每一层所添加的配置文件,如果我们可以把每一层的修改、安装、构建、操作的命令都写入一个脚本,然后用这个脚本来构建、定制镜像,那么镜像构建透明性的问题、体积的问题就会得到解决,这个脚本就是 Dockerfile; Dockerfile 是一个文本文件,其内包含了一条条的指令,每一条指令构建一层,每一层指令的内容,就是描述该层应该如何构建,然后通过 commit 构成新的镜像。
Dockerfile 参数
FROM
1,FROM:指定基础镜像,必须是第一条指令
# 定制 nginx 镜像的 Dockerfile FROM nginx RUN echo '<h1>Hello,Docker!</h1>' > /usr/share/nginx/html/index.html
注: Docker Hub 上有很多高质量的服务类的官方镜像可以拿来直接使用,比如:nginx 、redis 、mysql 、php 、mongo tomcat 等,可以在其中找最符合的一个进行定制
另外也有一些方便开发、构建、运行各种语言的镜像,比如:node 、python 、golang 等
如果没有找到对应服务的镜像,官方镜像中还提供了一些更为基础的操作系统镜像,比如:ubuntu 、debian 、fedora 、centos 等,也可以利用这些操作系统提供的软件库
RUN
2,RUN :用来执行命令行命令,格式有两种:
1, shell 格式: RUN <命令>,就像直接在命令行中输入的命令一样
2, exec 格式:RUN ["可执行文件",“参数1”,“参数2”],更像是函数调用中的格式
warning:每一个RUN命令都会在 docker镜像中新建一层,所以应该尽量少用 RUN 命令,而且要在RUN 的最后要做必要的清除工作
# 构建层次太多,未做清理工作 FROM debian:stretch RUN apt-get update RUN apt-get install -y gcc libc6-dev make wget RUN wget -O redis.tar.gz "http://download.redis.io/releases/redis-5.0.3.tar.gz" RUN mkdir -p /usr/src/redis RUN tar -xzf redis.tar.gz -C /usr/src/redis --strip-components=1 RUN make -C /usr/src/redis RUN make -C /usr/src/redis install
# 一层构建,并在最后清理压缩包等缓存文件 FROM debian:stretch RUN buildDeps='gcc libc6-dev make wget' && apt-get update && apt-get install -y $buildDeps && wget -O redis.tar.gz "http://download.redis.io/releases/redis-5.0.3.tar.gz" && mkdir -p /usr/src/redis && tar -xzf redis.tar.gz -C /usr/src/redis --strip-components=1 && make -C /usr/src/redis && make -C /usr/src/redis install && rm -rf /var/lib/apt/lists/* && rm redis.tar.gz && rm -r /usr/src/redis && apt-get purge -y --auto-remove $buildDeps
Dockerfile 上下文
3, Dockerfile 上下文:
# 构建新的镜像 # -t :指定镜像名称和 tag # . : 上下文,表示将本路径下的所有文件打包上传到 docker daemon,进行定制镜像 $ docker build -t nginx:v3 .
COPY
4, COPY : 用来从构建上下文目录中<原路径>的文件/目录复制到新一层镜像内的 <目标路径>位置,格式有两种:
1,shell 格式:COPY [--chown=<user>:<group>] <原路径>...<目标路径>
2,exec 合适:COPY[--chown=<user>:<group>] ["原路径1",... "<目标路径>"]
原路径:可以是多个,甚至可以是通配符
目标路径:可以是容器内的绝对路径,也可以是相对于工作目录的相对路径(工作目录可以用 WORKDIR 指令来指定,不需要事先创建,会自动创建)
1 # 利用 通配符 进行复制 2 COPY hom* /mydir/ 3 COPY hom?.txt /mydir/
note : COPY 会将原文件的各种数据都保留,比如 读、写、执行权限,可以通过 --chown=<user>:<group> 选项来改变文件的所属用户及所属组。
ADD
5,ADD : 和 COPY 指令的功能,性质基本一致,也可以通过 --chown 改变文件所属用户和所属组,但是在 COPY 的基础上增加了一些功能:
1,原路径为 URL : Docker 会试图下载这个文件放到 目标路径去,默认下载后的文件权限为 600,如果想要修改权限或者下载的是压缩包,需要解压,则还需要额外的一层 RUN 进行调整,还不如直接用 RUN 指令用 wget 进行下载,处理权限,解压缩,然后清理无用文件更合理,所以该命令不常用,而且不推荐使用。
2,原路径为 tar 压缩包 : 如果压缩文件格式为 gzip , bzip2 以及 xz 的情况下,ADD 指令将自动解压这个压缩文件到 <目标路径> 去,只有此种情况适合使用 ADD 指令。
note: ADD 指令可能会使镜像构建缓存失效,从而可能会令镜像的构建变的比较缓慢,镜像构造缓存点击这里查看
CMD
6,CMD : 和 RUN 指令相似,也是两种格式:
1,shell 格式:CMD <命令>
2,exec 格式 : CMD ["可执行文件",“参数1”,“参数2” ...]
3,参数格式列表:在指定了 ENTRYPOINT 指令后,用 CMD 指定具体的参数
CMD 指令用于指定默认的容器主进程的启动命令的,例如 ubuntu 默认的 CMD 是 bash ,我们也可以在容器运行时指定运行别的命令,如:
# 直接进入 bash $ docker run -it ubuntu # 修改默认的 CMD # docker run -it ubuntu cat /etc/os-release
note1: 在指令格式上,一般推荐使用 exec 格式,这类格式在解析时会被解析为 JSON 数组,因此一定要用 双引号 “ 而不要使用单引号 。
# 如果执行 CMD echo $HOME # 实际执行会变更为: CMD ["sh" "-c" "echo $HOME"]
note2 : 容器的前台执行和后台执行问题
注:Docker 不是虚拟机,容器中的应用都应该以前台执行,而不能像虚拟机用 systemd 去启动后台服务,容器内没有后台服务的概念。例如:
# 错误代码 # 目的:启动 nginx 在后台以守护进程的形式在运行 CMD service nginx start # 实际上执行 # sh 为主进程,执行完成进程退出,导致容器也会退出 CMD ["sh" "-c" "service nginx start"] # 正确做法 # nginx :可执行文件 CMD ["nginx", "-g", "daemon off;"]
ENTRYPOINT
7, ENTRYPOINT:格式和 RUN 指令格式一样,分为 exec 格式和 shell 格式,目的和 CMD 一样,都是在指定容器启动程序及参数;当指定了 ENTRYPOINT 后,CMD 的含义就发生了变化,不再是直接的运行其命令,而是将 CMD 的内容作为参数传给 ENTRYPOINT 指令,换句话说实际执行时,将变为: <ENTRYPOINT>"<CMD>"
用处 1 : 让镜像变成向命令一样使用:
# 如果我们需要一个得知自己当前的公网 IP 的镜像 # Dockerfile 内容: FROM ubuntu:18.04 RUN apt-get update && apt-get install -y curl && rm -rf /var/lib/apt/lists/* CMD ["curl", "-s", "https://ip.cn"] # 构建镜像 docker build -t myip . # 查询 ip 操作 # 不能添加参数,如上面的 -s 参数 docker run myip # 希望显示 HTTP 头信息,需要加上 -i 参数 # 试图添加参数,会报错,因为在容器后加入参数,会被解析成 CMD 命令,但 -i 不是任何命令 docker run myip -i # 用 ENTRYPOINT 的方式 # Dockerfile 内容: FROM ubuntu:18.04 RUN apt-get update && apt-get install -y curl && rm -rf /var/lib/apt/lists/* ENTRYPOINT ["curl", "-s", "https://ip.cn"] # 查询 ip 操作,可加参数 # 此时 CMD 的内容 -i 传递给了主进程 curl docker run myip -i
用处 2 : 应用运行前的准备工作:比如数据库配置,初始化工作,此时可以传 ENTRYPOINT 一个脚本,然后通过 CMD 指定参数,在脚本最后执行
1 # allow the container to be started with `--user` 2 # Dockerfile 3 FROM alpine:3.4 4 RUN addgroup -S redis && adduser -S -G redis redis 5 ... 6 ENTRYPOINT ["docker-entrypoint.sh"] 7 EXPOSE 6379 8 CMD ["redis-server"] 9 10 # docker-entrypoint.sh 脚本文件 11 #!/bin/bash 12 if [ "$1" = 'redis-server' -a "$(id -u)" = '0' ]; then 13 chown -R redis . 14 exec su-exec redis "$0" "$@" 15 fi 16 exec "$@"
ENV
8, ENV : 用来设置环境变量,格式有两种:
1,ENV <key> <value>
2,ENV <key1>=<value1> <key2>=<value2>...
在设置了环境变量之后,无论是后面的其它指令,如 RUN ,还是运行时的应用,都可以直接使用这里定义的环境变量
# 定义环境变量 ENV VERSION=1.0 DEBUG=ON NAME="Happy Feet" # 官方 node 镜像 Dockerfile 中: ENV NODE_VERSION 7.2.0 RUN curl -SLO "https://nodejs.org/dist/v$NODE_VERSION/node-v$NODE_VERSION-linux-x64.tar.xz" && curl -SLO "https://nodejs.org/dist/v$NODE_VERSION/SHASUMS256.txt.asc" && gpg --batch --decrypt --output SHASUMS256.txt SHASUMS256.txt.asc && grep " node-v$NODE_VERSION-linux-x64.tar.xz$" SHASUMS256.txt | sha256sum -c - && tar -xJf "node-v$NODE_VERSION-linux-x64.tar.xz" -C /usr/local --strip-components=1 && rm "node-v$NODE_VERSION-linux-x64.tar.xz" SHASUMS256.txt.asc SHASUMS256.txt && ln -s /usr/local/bin/node /usr/local/bin/nodejs
ARG
9, ARG : 构建参数,格式:
1,ARG <参数名>[=<默认值>]
构建参数和 ENV 的效果一样,都是设置环境变量,所不同的是,ARG 所设置的是构建环境的环境变量,在将来容器运行时是不会存在这些环境变量的。
VOLUME
10,VOLUME:定义匿名卷,格式为:
1,VOLUME ["<路径1>”,”<路径2>"...]
2,VOLUME <路径>
之前说过,容器运行时应该尽量保持容器存储层不发生写操作,对于数据库类需要保存动态数据的应用,其数据库文件应该保存在卷中,为了防止运行时用户忘记将动态文件所保存目录挂载为卷,在 Dockerfile 中,我们可以事先指定某些目录挂载为匿名卷,这样在运行时如果用户不指定挂载,其应用也可以正常运行,不会向容器存储层写入大量数据。
# /data 目录会在运行时自动挂载为匿名卷 VOLUME /data # 运行时也可以覆盖这个挂载设置 # 用 mydata 这个命名卷挂载到了 /data 这个位置,代替 Dockerfile 中的匿名卷的挂载配置 docker run -d -v mydata:/data xxxx
EXPOSE
11,EXPOSE:声明端口,格式为:
EXPOSE <端口1> [<端口2>...]
该条指令是声明运行时容器提供的服务端口,这只是一个声明,在运行时并不会因为这个声明应用就会开启这个端口的服务。这样声明带来两个好处:
1,帮助镜像使用者理解这个镜像服务的守护端口,以方便配置映射
2,在运行时使用随机端口映射,也就是 docker run -P 时,会自动随机映射 EXPOSE 的端口
note: 要将 EXPOSE 和在运行时使用 -p <宿主端口>:<容器端口> 区分开来。-p 是映射宿主端口和容器端口,就是将容器的对应端口服务公开给外界访问,而 EXPOSE 仅仅是声明容器打算使用什么端口而已,并不会在宿主进行端口映射。
WORKDIR
12, WORKDIR : 指定工作目录,格式为:
WORKDIR <工作目录路径>
该条指令可以来指定工作目录(或者称为当前目录),以后各层的当前目录就被改为指定的目录,如果该目录不存在,则会自动建立。
# 常见错误 $ RUN cd /app $ RUN echo "hello" > word.txt /× 如果将这个 Dockerfile 进行构建镜像运行后,会发现根本找不到 /app/word.txt 文件,这是 因为在 Dockerfile 中,这两行 RUN 命令的执行环境根本不同,是两个完全不同的容器。 没一个 RUN 都是启动一个容器、执行命令、然后提交存储层文件变更;第一层的执行仅仅是 当前进程的工作目录变更,一个内存上的变化而已,其结果不会造成任何文件改变;而到了第 二层的时候,启动的是一个全新的容器,跟第一层的容器更完全没有关系,自然不可能继承前一层构建过程中的内存变化。 ×/ /× 因此,如果需要改变以后各层的工作目录的位置,那么应该使用 WORKDIR 指令 ×/
USER
13,USER:指定当前用户,格式为:
USER <用户名>[:<用户组>]
该条指令和 WORKDIR 相似,都是改变环境状态并影响以后的层,WORKDIR 是改变工作目录, USER 是改变之后层的执行 RUN ,CMD 以及 ENTRYPOINT 这类命令的身份。如果以 root 执行的脚本,在执行期间希望改变身份,比如希望以某个已经建立好的用户来运行某个服务进程,不要使用 su 或者 sudo ,这些都需要比较麻烦的配置,而且在 TTY 缺失的情况下经常出错,建议使用 gosu 。
# 建立 redis 用户,并使用 gosu 换另一个用户执行命令 RUN groupadd -r redis && useradd -r -g redis redis # 下载 gosu RUN wget -O /user/local/bin/gosu "https://github.com/tianon/gosu/releases/download/1.7/gosu-amd64" && chmod +x /usr/local/bin/gosu && gosu nobody true # 设置 CMD ,并以另外的用户执行 CMD ["exec", "gosu", "redis", "redis-server"]
HEALTHCHECK
14,HEALTHCHECK:健康检查,格式为:
HEALTHCHECK [选项] CMD <命令> :设置检查容器健康状况的命令
HEALTHCHECK NONE : 如果基础镜像有健康检查指令,使用这行可以屏蔽掉其健康检查指令
options:
--interval=<间隔> :两次健康检查的间隔,默认为 30s;
--timeout=<时长>: 健康检查命令运行超时时间,如果超过这个时间,本次健康检查就被视为失败,默认 30s;
--retries=<次数> : 当连续失败指定次数后,则将容器状态视为 unhealthy ,默认 3 次;
return value:
0 : 成功
1:失败
2:保留(不要使用这个值)
ONBUILD
15,ONBUILD:后构建指令,格式为:
ONBUILD <其它指令>
ONBUILD 是一个特殊的指令,它后面跟的是其它指令,比如 RUN,COPY 等,而这些指令,在当前镜像构建时并不会被执行。只有当以以前镜像为基础镜像,去构建下一级镜像的时候才会被执行。