zoukankan      html  css  js  c++  java
  • docker 网络设置概述

    docker有3种网络:

    使用命令docker network ls,执行结果如下。

    NETWORK ID          NAME                DRIVER              SCOPE
    82e8822065c7        bridge              bridge              local
    a36f938bc6c6        host                host                local
    55ee9a442ee8        none                null                local
    

    1,bridge:是NAT Bridge。在宿主机器上创建一个软件的交换机或者是网卡。

    ifconfig可以看到多了个【docker0】。

    【docker0】既可以作为交换机,也可以作为网卡。不给它地址就是交换机,给它地址就既能当交换机也能当网卡。

    linux内核可以为进程创建虚拟网卡对,这个网卡对就像网线一样,有2个头。

    一头连接到自己进程所属的网络命名空间,另一头连接任何地方。

    linux内核也可以创建软件交换机,使用【brctl】命令创建。

    创建虚拟网络,以实现让进程C1和进程C2可以通信。

    • 步骤1:创建一个网线m
    • 步骤2:创建一个网线n
    • 步骤3:创建一个虚拟交换机S1。
    • 步骤4:让网线m的一端连上进程C1所属的网络命名空间,让网线m的另一端连上虚拟交换机S1。
    • 步骤5:让网线n的一端连上进程C2所属的网络命名空间,让网线n的另一端连上虚拟交换机S1。
    • 进程C1和进程C2就可以通信了。

    创建虚拟网络,以实现让进程C1和进程C3可以通信。

    • 步骤1:创建一个网线k
    • 步骤2:创建一个虚拟交换机S2。
    • 步骤3:创建一个图中间的微内核,让这个内核代替路由器。或者不需要路由器的话,创建1根网线,连接S1和S2,这样一来就不需要步骤4了。
    • 步骤4:创建2根网线,让S1和S2都连都微内核上。
    • 进程C1和进程C3就可以通信了。

    有个著名的开源的创建虚拟交换机的软件:OVS(OpenVSwitch).

    overlay network(叠加网络)

    C1(192.168.1.3)和C5(192.168.1.4)在同一个网段,物理机器h1(10.1.1.3)和h2(10.1.1.4)连接在同一个交换机上。因为C1和C5在同一个网段,所以它们2个可以互相看见,当C1要发送数据给C5时,ip报文里是C1:C5,然后经过虚拟网桥(docker0),转发给物理机器h1,物理机器h1在【ip报文C1:C5】外面再包裹一层【h1:h2】,物理机器h2接受到报文后,拆掉外层的【h1:h2】,发现里面还有【C1:C5】,所以通过虚拟网桥(docker0),转发给C5。

    上图里面的【docker0】,就是在运行docker daemon进程的机器上,执行ifconfig,看到的【docker0】,它是nat bridge。每启动一个容器,就产生一条网线,一端就插在【docker0】上,一端插在自己容器的网络命名空间上。

    那么如何查看,【docker0】上插了几根网线呢?

    使用【yum install bridge-utils】里面的【brctl show】命令,查看网桥上插了哪些网线。

    [root@localhost ys]# brctl show
    bridge name     bridge id               STP enabled     interfaces
    docker0         8000.0242af11c649       no              veth93593bc
                                                            vethc7cb2ca
    
    

    从上面的执行结果可以看出来,在【docker0】上插了2根网线分别是veth93593bc和vethc7cb2ca。用在宿主机上使用ifconfig,可以看到这2个网线。

    [root@localhost ys]# ifconfig
    veth93593bc: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
            inet6 .....  prefixlen 64  scopeid 0x20<link>
            ether .....  txqueuelen 0  (Ethernet)
            RX packets 0  bytes 0 (0.0 B)
            RX errors 0  dropped 0  overruns 0  frame 0
            TX packets 8  bytes 656 (656.0 B)
            TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
    vethc7cb2ca: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
            inet6 ..  prefixlen 64  scopeid 0x20<link>
            ether .....  txqueuelen 0  (Ethernet)
            RX packets 0  bytes 0 (0.0 B)
            RX errors 0  dropped 0  overruns 0  frame 0
            TX packets 8  bytes 656 (656.0 B)
            TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
    

    使用【ip link show】也可以看到veth93593bc和vethc7cb2ca,而且还可以发现veth93593bc的另一端是if14,vethc7cb2ca的另一端是if12

    [root@localhost ys]# ip link show
    5: docker0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue state UP mode DEFAULT group default
        link/ether 02:42:af:11:c6:49 brd ff:ff:ff:ff:ff:ff
    13: vethc7cb2ca@if12: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue master docker0 state UP mode DEFAULT group default
        link/ether a2:a3:b8:3c:8c:88 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    15: veth93593bc@if14: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue master docker0 state UP mode DEFAULT group default
        link/ether b2:24:a8:13:4d:56 brd ff:ff:ff:ff:ff:ff link-netnsid 1
    

    【iptables -t nat -vnL】查看,发现了下面的规则,所以说明docker0是nat bridge。

    iptables种的DNAT和SNAT概念

    Chain POSTROUTING (policy ACCEPT 47 packets, 3073 bytes)
     pkts bytes target     prot opt in     out     source               destination
        0     0 MASQUERADE  all  --  *      !docker0  172.17.0.0/16        0.0.0.0/0
    
    

    in:*,代表:从任何接口进来

    out:!docker0,代表:不从docker0出去

    source:172.17.0.0/16,代表:原地址来自172.17.0.0/16的任何主机地址,

    destination:0.0.0.0/0,代表:发送到任何主机地址,

    target:MASQUERADE,代表:做源地址转换 (SNAT ),也就是自动在本机上选择一个源地址。

    把上面的话连接起来的意思:从任何接口进来,不从docker0出去,原地址是来自172.17.0.0/16的任何主机地址,发送到任何主机地址,做源地址转换。

    创建网络命名空间

    查看ip命令的工具包是否安装:rpm -q iproute

    使用ip命令,看到object里有网络命名空间(netns),所以我们用ip命令就可以创建网络命名空间。

    [root@localhost ys]# ip
    Usage: ip [ OPTIONS ] OBJECT { COMMAND | help }
           ip [ -force ] -batch filename
    where  OBJECT := { link | address | addrlabel | route | rule | neigh | ntable |
                       tunnel | tuntap | maddress | mroute | mrule | monitor | xfrm |
                       netns | l2tp | fou | macsec | tcp_metrics | token | netconf | ila |
                       vrf }
           OPTIONS := { -V[ersion] | -s[tatistics] | -d[etails] | -r[esolve] |
                        -h[uman-readable] | -iec |
                        -f[amily] { inet | inet6 | ipx | dnet | mpls | bridge | link } |
                        -4 | -6 | -I | -D | -B | -0 |
                        -l[oops] { maximum-addr-flush-attempts } | -br[ief] |
                        -o[neline] | -t[imestamp] | -ts[hort] | -b[atch] [filename] |
                        -rc[vbuf] [size] | -n[etns] name | -a[ll] | -c[olor]}
    
    • 获得ip netns命令的帮助信息:

      [root@localhost ys]# ip netns help
      Usage: ip netns list//查看当前系统里的网络命名空间
             ip netns add NAME//添加网络命名空间
             ip netns set NAME NETNSID
             ip [-all] netns delete [NAME]
             ip netns identify [PID]//让某个进程使用某个网络命名空间
             ip netns pids NAME
             ip [-all] netns exec [NAME] cmd ...//在某个网络命名空间上执行网络命令。
             ip netns monitor
             ip netns list-id
      
    • 命令ip netns使用例子:创建网络命名空间和查看网络命名空间

      [root@localhost ys]# ip netns list
      [root@localhost ys]# ip netns add ns1
      [root@localhost ys]# ip netns add ns2
      [root@localhost ys]# ip netns list
      ns2
      ns1
      
    • 获取ip link命令的帮助信息:ip link help

      [root@localhost ys]# ip link help
      Usage: ip link add [link DEV] [ name ] NAME
                         [ txqueuelen PACKETS ]
                         [ address LLADDR ]
                         [ broadcast LLADDR ]
                         [ mtu MTU ] [index IDX ]
                         [ numtxqueues QUEUE_COUNT ]
                         [ numrxqueues QUEUE_COUNT ]
                         type TYPE [ ARGS ]
      ...后面太多了,省略了。
      
    • 在指定的网络命名空间里执行网络命令:

      # ip netns exec ns1 ifconfig 
      
    • 给网络命名空间创建网线(虚拟网卡对),命令里面的【type】是网卡对的类型,veth是以太网。

      # ip link add name veth1.1 type veth peer name veth1.2
      

      使用ip link show可以看到刚创建的veth1.1和veth1.2,他们互为一对,而且他们都是插宿主机上的。

      22: veth1.2@veth1.1: <BROADCAST,MULTICAST,M-DOWN> mtu 1500 qdisc noop state DOWN mode DEFAULT group default qlen 1000
          link/ether 4e:e3:65:60:bb:08 brd ff:ff:ff:ff:ff:ff
      23: veth1.1@veth1.2: <BROADCAST,MULTICAST,M-DOWN> mtu 1500 qdisc noop state DOWN mode DEFAULT group default qlen 1000
          link/ether 2a:16:5b:ce:fe:f6 brd ff:ff:ff:ff:ff:ff
      
      

      使用ifconfig,发现他们都没有被显示出来,因为还没有激活他们。用ifconfig -a是可以显示出来的。

      先创建一个网络命名空间:ip netns add ns1,然后让veth1.2插在ns1上。

      # ip link set dev veth1.2 netns ns1
      

      然后在宿主机网络命名空间上执行ip link show,发现veth1.2没有了。因为veth1.2已经到ns1网络命名空间里了。

      23: veth1.1@if22: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN mode DEFAULT group default qlen 1000
          link/ether 2a:16:5b:ce:fe:f6 brd ff:ff:ff:ff:ff:ff link-netnsid 0
      
      

      再去ns1网络命名空间里,执行ip netns exec ns1 ifconfig -a,发现veth1.2在里面。

      veth1.2: flags=4098<BROADCAST,MULTICAST>  mtu 1500
              ether 4e:e3:65:60:bb:08  txqueuelen 1000  (Ethernet)
              RX packets 0  bytes 0 (0.0 B)
              RX errors 0  dropped 0  overruns 0  frame 0
              TX packets 0  bytes 0 (0.0 B)
              TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
      

      也可以修改veth1.2的名字,修改成eth0.

      # ip netns exec ns1 ip link set dev veth1.2 name eth0
      

      执行ip netns exec ns1 ifconfig -a,发现变成了eth0了。

      eth0: flags=4098<BROADCAST,MULTICAST>  mtu 1500
              ether 4e:e3:65:60:bb:08  txqueuelen 1000  (Ethernet)
              RX packets 0  bytes 0 (0.0 B)
              RX errors 0  dropped 0  overruns 0  frame 0
              TX packets 0  bytes 0 (0.0 B)
              TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
      
    • 让虚拟网卡插在某个网络命名空间。

      # ip link set dev veth1.2 netns ns1
      
    • 激活虚拟网卡(赋给它IP就是激活)。

      激活veth1.1

      # ifconfig veth1.1 10.1.0.1/24 up
      

      执行ifconfig,发现虚拟网卡veth1.1有ip地址了。

      veth1.1: flags=4099<UP,BROADCAST,MULTICAST>  mtu 1500
              inet 10.1.0.1  netmask 255.255.255.0  broadcast 10.1.0.255
              ether 2a:16:5b:ce:fe:f6  txqueuelen 1000  (Ethernet)
              RX packets 0  bytes 0 (0.0 B)
              RX errors 0  dropped 0  overruns 0  frame 0
              TX packets 0  bytes 0 (0.0 B)
              TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
      

      激活ns1里的eth0

      # ip netns exec ns1 ifconfig eth0 10.1.0.2/24 up
      

      执行ifconfig,发现虚拟网卡eth0有ip地址了。

      eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
              inet 10.1.0.2  netmask 255.255.255.0  broadcast 10.1.0.255
              inet6 fe80::4ce3:65ff:fe60:bb08  prefixlen 64  scopeid 0x20<link>
              ether 4e:e3:65:60:bb:08  txqueuelen 1000  (Ethernet)
              RX packets 11  bytes 1447 (1.4 KiB)
              RX errors 0  dropped 0  overruns 0  frame 0
              TX packets 7  bytes 586 (586.0 B)
              TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
             
      

      从宿主机ping一下ns1里的eth0,是可以ping通的。

      # ping 10.1.0.2
      PING 10.1.0.2 (10.1.0.2) 56(84) bytes of data.
      64 bytes from 10.1.0.2: icmp_seq=1 ttl=64 time=0.073 ms
      

      再从ns1ping一下宿主机的veth1.1,也是可以ping通的。

      # ip netns exec ns1 ping 10.1.0.1
      PING 10.1.0.1 (10.1.0.1) 56(84) bytes of data.
      64 bytes from 10.1.0.1: icmp_seq=1 ttl=64 time=0.039 ms
      
    • 使用ip命令可以创建虚拟网卡,使用brctl,可以创建虚拟交换机,有了它俩,就可以模拟很多虚拟网络,比如物理桥,nat桥等,不需要安装额外的虚拟机,很轻量。

    有个问题,docker容器间是如何互相通信的呢?

    • 假设容器都是以bridge方式启动

      • 2个容器都插在docker0上,那么这2个容器都在172.17网段上,互相通信没有任何问题。

      • 容器和宿主机互相通信没有问题。

      • 客户端CL1,要通过80端口访问nginx容器WEB1,但是客户端CL1同nginx容器WEB1在不同的网络,如何通信呢?nginx容器WEB1所在的宿主机只能使用DNAT技术,才能实现通信。也就是说客户端CL1访问的是宿主机,宿主机再转发给nginx容器WEB1。

        这就有个问题了,如果web2和web3也是nginx,也要使用80端口,那么宿主机转发的时候就不知道转给哪个容器了。

    另一种方式:容器可以有独立的6个命名空间,为了2个容器间可以用lo(127.0.0.1)通信,让他们只拥有3个(user,mount, pid)独立的命名空间,另外3个(uts, net, ipc)他们共享使用。

    二,host:

    容器间可以共用3个(uts, net, ipc)空间,那么容器可以和宿主机(docker daemon进程所运行的机器)共用吗?是可以的。让一个容器A和宿主机共用3个(uts, net, ipc)空间,让其他的容器使用桥接,这样一来容器A就有了管理网络的特权。这就是docker的host连接方式。

    三,none:容器没有网卡,只有lo。所以不能网络通信。

    docker 网络种类:

    查看网络连接具体信息的命令(inspect 可以查看任何docker object):

    # docker network inspect bridge/host/none
    

    查看容器的网络连接具体信息。

    # docker container inspect ng1
    

    c/c++ 学习互助QQ群:877684253

    本人微信:xiaoshitou5854

  • 相关阅读:
    双重标准,我该怎么解决
    今天突然点开一个网页
    反省
    (无)
    (无)
    GetModuleHandleW 分析
    关于逆向360相关的一点感想
    OpenGL的编译和使用
    360 补天平台,也没个什么人啊。。。
    openssl编译方法
  • 原文地址:https://www.cnblogs.com/xiaoshiwang/p/11979052.html
Copyright © 2011-2022 走看看