zoukankan      html  css  js  c++  java
  • Docker网络基础

    Kubernetes的网络依赖于Docker,Docker的网络又离不开Linux操作系统内核特性的支持,所以我们有必要先深入了解Docker背后的网络原理和基础知识。Docker 使用到的与Linux网络有关的主要技术包括:网络命名空间(network namespace)、Veth设备对、网桥(bridge)、iptables和路由。本文对这几个技术做一个入门性的介绍。

    1. Network Namespace

    network namespace是namespace隔离中的一种,主要提供关于网络资源的隔离,包括网络设备、网络协议栈、ip路由表、iptables等等。通过对网络资源的隔离,就能在一个宿主机上虚拟出多个不同的网络环境,给外部用户一种透明的感觉,用户仿佛在与一个独立的网络实体进行通信。Docker正是利用了网络的命名空间特性,实现了不同容器之间的网络隔离。


    下面是一些简单的network namespace相关的命令操作。(接下来的实验需要用到)


    ip netns add <name>

    在/var/run/netns 目录下可以看到创建出来的命名空间:

    ls /var/run/netns


    ip netns exec <name> <command>


    ip netns exec <name> bash

    2. Veth 设备对

    Veth设备即Virtual Ethernet Device(虚拟以太网设备),引入Veth设备对是为了在不同的网络命名空间之间通信,这个在上一小节已经提到过了,利用它可以直接将两个网络命名空间连接起来。由于要连接两个网络命名空间, 所以Veth设备都是成对出现的。下面参考 veth man-page ,给出了 veth 的官方解释:

    The veth devices are virtual Ethernet devices. They can act as tunnels between network namespaces to create a bridge to a physical network device in another namespace, but can also be used as standalone network devices. veth devices are always created in interconnected(互相连接的) pairs. A pair can be created using the command:

    // 创建veth设备对
    # ip link add <p1-name> type veth peer name <p2-name>

    p1-name and p2-name are the names assigned to the two connected end points. Packets transmitted on one device in the pair are immediately received on the other device.

    veth device pairs are useful for combining the network facilities of the kernel together in interesting ways. A particularly interesting use case is to place one end of a veth pair in one network namespace and the other end in another network namespace, thus allowing communication between network namespaces. To do this, one first creates the veth device as above and then moves one side of the pair to the other namespace:

    // 将veth设备对的一端(即<p2-name>)移至<p2-namespace>命名空间中
    # ip link set <p2-name> netns <p2-namespace> 


    root@ubuntu:~# ip netns add ns1
    root@ubuntu:~# ip netns add ns2
    #可以看到,在/var/run/netns 目录下已经出现了刚刚创建的两个namespace
    root@ubuntu:~# ls /var/run/netns/
    ns1  ns2
    root@ubuntu:~# ip link add veth0 type veth peer name veth1
    root@ubuntu:~# ip link set veth0 netns ns1
    root@ubuntu:~# ip link set veth1 netns ns2
    #在ns1的namespace中查看网络设备,发现 veth0
    root@ubuntu:~# ip netns exec ns1 ip link
    1: lo: <LOOPBACK> mtu 65536 qdisc noop state DOWN mode DEFAULT group default qlen 1
        link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    4: veth0@if3: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN mode DEFAULT group default qlen 1000
        link/ether e2:42:ce:d6:d9:13 brd ff:ff:ff:ff:ff:ff
    #在ns1的namespace中查看网络设备,发现 veth1    
    root@ubuntu:~# ip netns exec ns2 ip link
    1: lo: <LOOPBACK> mtu 65536 qdisc noop state DOWN mode DEFAULT group default qlen 1
        link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    3: veth1@if4: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN mode DEFAULT group default qlen 1000
        link/ether fa:55:90:67:19:dc brd ff:ff:ff:ff:ff:ff

    可以看到,在ns1和ns2这两个命名空间中,除了LOOPBACK的设备以外,就只看到了一个网络设备,也就是veth。当请求发送到这个虚拟网络设备时,会原封不动的从另外一个network namespace的网络接口中出来。如下图所示:

    root@ubuntu:~# ip netns exec ns1 ifconfig veth0 up
    root@ubuntu:~# ip netns exec ns2 ifconfig veth1 up
    root@ubuntu:~# ip netns exec ns1 route add default dev veth0
    root@ubuntu:~# ip netns exec ns2 route add default dev veth1
    root@ubuntu:~# ip netns exec ns1 ping -c 1
    PING ( 56(84) bytes of data.
    64 bytes from icmp_seq=1 ttl=64 time=0.049 ms
    --- ping statistics ---
    1 packets transmitted, 1 received, 0% packet loss, time 0ms
    rtt min/avg/max/mdev = 0.049/0.049/0.049/0.000 ms

    3. 网桥

    什么是 Bridge

    An ethernet bridge is a device commonly used to connect different networks of ethernets together, so that these ethernets will appear as one ethernet to the participants. Each of the ethernets being connected corresponds to one physical interface in the bridge. These individual ethernets are bundled into one bigger ('logical') ethernet, this bigger ethernet corresponds to the bridge network interface.


    Linux 网桥的实现

    Linux内核是通过一个虚拟的网桥设备(Net Device)来实现桥接的。这个虚拟设备可以绑定若干个以太网接口设备,从而将它们桥接起来。如下图所示,这种Net Device网桥和普通的设备不同,最明显的一个特性是它还可以有一个IP地址



    为了继续实验,这里先简单了解一下 brctl 命令。(参考:brctl man-page

    brctl is used to set up, maintain, and inspect the ethernet bridge configuration in the Linux kernel.


    # brctl addbr <name>
    The command brctl addbr <name> creates a new instance of the ethernet bridge. The network interface corresponding to the bridge will be called <name>.
    # brctl delbr <name>
    The command brctl delbr <name> deletes the instance <name> of the ethernet bridge. The network interface corresponding to the bridge must be down before it can be deleted!
    # brctl show
    The command brctl show shows all current instances of the ethernet bridge.


    # brctl addif <brname> <ifname>
    The command brctl addif <brname> <ifname> will make the interface <ifname> a port of the bridge <brname>. This means that all frames received on <ifname> will be processed as if destined for the bridge. Also, when sending frames on <brname>, <ifname> will be considered as a potential output interface.
    # brctl delif <brname> <ifname>
    The command brctl delif <brname> <ifname> will detach the interface <ifname> from the bridge <brname>.
    # brctl show <brname>
    The command brctl show <brname> will show some information on the bridge and its attached ports.


    root@ubuntu:~# ip netns add ns1
    Cannot not create namespace file "/var/run/netns/ns1": File exists
    root@ubuntu:~# ip link add veth0 type veth peer name veth1
    root@ubuntu:~# ip link set veth1 netns ns1
    root@ubuntu:~# brctl addbr br0
    root@ubuntu:~# brctl addif br0 veth0
    root@ubuntu:~# brctl addif br0 eth0 // 不知道为什么,挂载了这个设备后,Xshell就不能连接虚拟机了

    现在来看一下网桥 br0 上挂载的设备

    root@ubuntu:~# brctl show
    bridge name	bridge id		STP enabled	interfaces
    br0		8000.e24b8d8900b0	no		veth0


    #启动虚拟网络设备,并设置它在network namespace中的IP地址
    root@ubuntu:~# ip link set veth0 up
    root@ubuntu:~# ip link set br0 up
    root@ubuntu:~# ip netns exec ns1 ifconfig veth1 up 
    #default 代表0.0.0.0/0,即在network namespace中所有流量都经过veth1的网络设备流出
    root@ubuntu:~# ip netns exec ns1 route add default dev veth1
    #在宿主机上将172.18.0.0/24 的网段请求路由到 br0 的网桥
    root@ubuntu:~# route add -net dev br0

    宿主机与network namespace的通信验证如下:(是我的虚拟机ip地址)

    4. iptables



    Netfilter负责在内核中执行各种挂接的规则,运行在内核模式中;而iptables是在用户模式下运行的进程,负责协助和维护内核中Netfilter的各种规则表。二者互相配合来实现整个Linux网络协议栈中灵活的数据包处理机制。在容器的虚拟化技术中,经常会用到两种策略MASQUERADEDNAT ,用于容器宿主机外部的网络通信


    iptables 中的 MASQUERADE 策略可以将请求包中的源地址转换成一个网络设备中的地址。 在namespace中请求宿主机外部地址时,将namespace中的源地址转换成宿主机的地址作为源地址,就可以在namespace中访问宿主机外的网络了。

    // 查看内核参数 net.ipv4.conf.all.forwarding,值为1表示打开这一策略
    $ sysctl net.ipv4.conf.all.forwarding
    net.ipv4.conf.all.forwarding = 1
    // 对 Namespace 中发出的包添加网络地址转换
    $ sudo iptables -t nat -A POSTROUTING -s 172 . 18.0.0/24 -o ethO -j MASQUERADE


    iptables 中的 DNAT 策略也是做网络地址的转换,不过它是负责转换目标地址(MASQUERADE 策略负责转换源地址),用于将内部网络地址的端口映射到外部去。比如,namespace 中如果需要提供服务给宿主机之外的应用去请求,外部应用是没办法直接路由到 这个地址的,这时候就可以用到 DNAT 策略


    // 将到宿主机上 80 端口的请求转发到 Namespace IP上
    $ sudo iptables -t nat -A PREROUTING -p tcp -m tcp --dport 80 -j DNAT --to-destination


    5. 路由



    1. 目的IP地址:此字段表示目标的IP地址。这个IP地址可以是某主机的地址,也可以是一个网络地址。
    2. 下一个路由器的IP地址:这里采用“下一个”的说法,是因为下一个路由器并不总是最终的目的路由器,它很可能是一个中间路由器。
    3. 标志:这个字段提供了另一组重要信息,例如,目的IP地址是一个主机地址还是一个网络地址。此外,从标志中可以得知下一个路由器是一个真实路由器还是一个直接相连的接口。
    4. 网络接口规范:为一些数据报文的网络接口规范,该规范将与报文一起被转发。


    1. 《Kubernetes权威指南(第4版)》
    2. 《自己动手写Docker》
  • 相关阅读:
    application , application pool., W3wp ,httpapplication, domain
    container docker
    Azure&& hdinsight
    Native Code
    重构 小步进行曲
  • 原文地址:https://www.cnblogs.com/kkbill/p/12885029.html
Copyright © 2011-2022 走看看