zoukankan      html  css  js  c++  java
  • 12-1 TCP/IP协议栈

    TCP/IP协议栈

    有限状态机FSM:Finite State Machine

    • CLOSED 没有任何连接状态
    • LISTEN 侦听状态,等待来自远方TCP端口的连接请求
    • SYN-SENT 在发送连接请求后,等待对方确认
    • SYN-RECEIVED 在收到和发送一个连接请求后,等待对方确认
    • ESTABLISHED 代表传输连接建立,双方进入数据传送状态
    • FIN-WAIT-1 主动关闭,主机已发送关闭连接请求,等待对方确认
    • FIN-WAIT-2 主动关闭,主机已收到对方关闭传输连接确认,等待对方发送关闭传输连接请求
    • TIME-WAIT 完成双向传输连接关闭,等待所有分组消失
    • CLOSE-WAIT 被动关闭,收到对方发来的关闭连接请求,并已确认
    • LAST-ACK 被动关闭,等待最后一个关闭传输连接确认,并等待所有分组消失
    • CLOSING 双方同时尝试关闭传输连接,等待对方确认
    • 客户端先发送一个FIN给服务端,自己进入了FIN_WAIT_1状态,这时等待接收服务端的报文,该报文会有三种可能:
      • 只有服务端的ACK
      • 只有服务端的FIN
      • 基于服务端的ACK,又有FIN
    • 1、只收到服务器的ACK,客户端会进入FIN_WAIT_2状态,后续当收到服务端的FIN时,回应发送一个ACK,会进入到TIME_WAIT状态,这个状态会持续2MSL(TCP报文段在网络中的最大生存时间, RFC 1122标准的建议值是2min).客户端等待2MSL,是为了当最后一个ACK丢失时,可以再发送一次。因为服务端在等待超时后会再发送一个FIN给客户端,进而客户端知道ACK已丢失
    • 2、只有服务端的FIN时,回应一个ACK给服务端,进入CLOSING状态,然后接收到服务端的ACK时,进入TIME_WAIT状态
    • 3、同时收到服务端的ACK和FIN,直接进入TIME_WAIT状态

    客户端的典型状态转移

    • 客户端通过connect系统调用主动与服务器建立连接connect系统调用首先给服务器发送一个同步报文段,使连接转移到SYN_SENT状态
    • 此后connect系统调用可能因为如下两个原因失败返回:
    • 1、如果connect连接的目标端口不存在(未被任何进程监听),或者该端口仍
      被处于TIME_WAIT状态的连接所占用(见后文),则服务器将给客户端发送一个复位报文段,connect调用失败。
    • 2、如果目标端口存在,但connect在超时时间内未收到服务器的确认报文段,则connect调用失败。
    • connect调用失败将使连接立即返回到初始的CLOSED状态。如果客户端成功收到服务器的同步报文段和确认,则connect调用成功返回,连接转移至ESTABLISHED状态
    • 当客户端执行主动关闭时,它将向服务器发送一个结束报文段,同时连接进入FIN_WAIT_1状态。若此时客户端收到服务器专门用于确认目的的确认报文段,则连接转移至FIN_WAIT_2状态。当客户端处于FIN_WAIT_2状态时,服务器处于CLOSE_WAIT状态,这一对状态是可能发生半关闭的状态。此时如果服务器也关闭连接(发送结束报文段),则客户端将给予确认并进入TIME_WAIT状态
    • 客户端从FIN_WAIT_1状态可能直接进入TIME_WAIT状态(不经过FIN_WAIT_2状态),前提是处于FIN_WAIT_1状态的服务器直接收到带确认信息的结束报文段(而不是先收到确认报文段,再收到结束报文段)
    • 处于FIN_WAIT_2状态的客户端需要等待服务器发送结束报文段,才能转移至TIME_WAIT状态,否则它将一直停留在这个状态。如果不是为了在半关闭状态下继续接收数据,连接长时间地停留在FIN_WAIT_2状态并无益处。连接停留在FIN_WAIT_2状态的情况可能发生在:客户端执行半关闭后,未等服务器关闭连接就强行退出了。此时客户端连接由内核来接管,可称之为孤儿连接(和孤儿进程类似)
    • Linux为了防止孤儿连接长时间存留在内核中,定义了两个内核参数:
      • /proc/sys/net/ipv4/tcp_max_orphans 指定内核能接管的孤儿连接数目
      • /proc/sys/net/ipv4/tcp_fin_timeout 指定孤儿连接在内核中生存的时间

    有限状态机

    半连接状态

    sync半连接和accept全连接队列:
    ss -lnt:

    • /proc/sys/net/ipv4/tcp_max_syn_backlog 未完成连接队列大小,建议调整大小为1024以上
    • /proc/sys/net/core/somaxconn 完成连接队列大小,建议调整大小为1024以上

    TCP超时重传

    • 异常网络状况下(开始出现超时或丢包),TCP控制数据传输以保证其承诺的可靠服务
    • TCP服务必须能够重传超时时间内未收到确认的TCP报文段。为此,TCP模块为每个TCP报文段都维护一个重传定时器,该定时器在TCP报文段第一次被发送时启动。如果超时时间内未收到接收方的应答,TCP模块将重传TCP报文段并重置定时器。至于下次重传的超时时间如何选择,以及最多执行多少次重传,就是TCP的重传策略
    • 与TCP超时重传相关的两个内核参数:
    • /proc/sys/net/ipv4/tcp_retries1,指定在底层IP接管之前TCP最少执行的重传次数,默认值是3
    • /proc/sys/net/ipv4/tcp_retries2,指定连接放弃前TCP最多可以执行的重传次数,默认值15(一般对应13~30min)

    拥塞控制

    • 网络中的带宽、交换结点中的缓存和处理机等,都是网络的资源。在某段时间,若对网络中某一资源的需求超过了该资源所能提供的可承受的能力,网络的性能就会变坏。此情况称为拥塞
    • TCP为提高网络利用率,降低丢包率,并保证网络资源对每条数据流的公平性。即所谓的拥塞控制
    • TCP拥塞控制的标准文档是RFC 5681,其中详细介绍了拥塞控制的四个部分:
      • 慢启动(slow start)、拥塞避免(congestion avoidance)、快速重传(fast retransmit)和快速恢复(fast recovery)。拥塞控制算法在Linux下有多种实现,比如reno算法、vegas算法和cubic算法等。它们或者部分或者全部实现了上述四个部分
    • 当前所使用的拥塞控制算法
      • /proc/sys/net/ipv4/tcp_congestion_control

    UDP特性

    • 工作在传输层
    • 提供不可靠的网络访问
    • 非面向连接协议
    • 有限的错误检查
    • 传输性能高
    • 无数据恢复特性
    • 更多关于udp的内核参数,可参看man 7 udp

    UDP包头

    UDP包头

    ARP

    ARP是将ip转换为MAC地址的协议:
    通过ip neigh ;arp -n ;
    查看arp表

    反向ARP

    IP协议

    Internet协议特征

    • 运行于 OSI 网络层
    • 面向无连接的协议
    • 独立处理数据包
    • 分层编址
    • 尽力而为传输
    • 无数据恢复功能

    IP PDU报头

    IP包头

    • 版本:占4位,指 IP 协议的版本目前的IP协议版本号为4
    • 首部长度:占4位,可表示的最大数值是15个单位,一个单位为4字节,因此IP 的首部长度的最大值是60字节
    • 区分服务:占8位,用来获得更好的服务,在旧标准中叫做服务类型,但实际上一直未被使用过.后改名为区分服务.只有在使用区分服务(DiffServ)时,这个字段才起作用.一般的情况下不使用
    • 总长度:占16位,指首部和数据之和的长度,单位为字节,因此数据报的最大长度为65535 字节.总长度必须不超过最大传送单元 MTU
    • 标识:占16位,它是一个计数器,通常,每发送一个报文,该值会加1, 也用于数据包分片,在同一个包的若干分片中,该值是相同的
    • 标志(flag):占3位,目前只有后两位有意义
    • DF: Don’t Fragment 中间的一位,只有当 DF=0 时才允许分片
    • MF: More Fragment 最后一位,MF=1表示后面还有分片,MF=0 表示最后
    • 片偏移:占13位,指较长的分组在分片后,该分片在原分组中的相对位置.片偏移以8个字节为偏移单位
    • 生存时间:占8位,记为TTL (Time To Live) 数据报在网络中可通过的路由器数的最大值,TTL 字段是由发送端初始设置一个 8 bit字段.推荐的初始值由分配数字RFC 指定,当前值为 64.发送 ICMP 回显应答时经常把 TTL 设为最大值 255
    • 协议:占8位,指出此数据报携带的数据使用何种协议以便目的主机的IP层将数据部分上交给哪个处理过程, 1表示为 ICMP 协议, 2表示为 IGMP 协议, 6表示为TCP 协议, 17表示为 UDP 协议
    • 首部检验和:占16位,只检验数据报的首部不检验数据部分.这里不采用 CRC 检验码而采用简单的计算方法
    • 源地址和目的地址:都各占4字节,分别记录源地址和目的地址

    IP地址

    • 它们可唯一标识 IP 网络中的每台设备
    • 每台主机(计算机、网络设备、外围设备)必须具有唯一的地址
    • IP地址由两部分组成
    • 网络ID:
      • 标识网络
      • 每个网段分配一个网络ID
    • 主机 ID:
      • 标识单个主机
      • 由组织分配给各设备

    IP地址分类

    IP类

    • A类:
      • 0 000 0000 - 0 111 1111: 1-127
      • 网络数:126, 127
      • 每个网络中的主机数:2^24-2
      • 默认子网掩码:255.0.0.0
      • 私网地址:10.0.0.0
    • B类:
      • 10 00 0000 - 10 11 1111:128-191
      • 网络数:2^14
      • 每个网络中的主机数:2^16-2
      • 默认子网掩码:255.255.0.0
      • 私网地址:172.16.0.0-172.31.0.0
    • C类:
      • 110 0 0000 - 110 1 1111: 192-223
      • 网络数:2^21
      • 每个网络中的主机数:2^8-2
      • 默认子网掩码:255.255.255.0
      • 私网地址:192.168.0.0-192.168.255.0
    • D类:组播
      • 1110 0000 - 1110 1111: 224-239
    • E类:保留未使用
      • 240-255

    IP公有地址

    IP私有地址

    特殊地质

    • 0.0.0.0
      • 0.0.0.0不是一个真正意义上的IP地址。它表示所有不清楚的主机和目的网络
    • 255.255.255.255
      • 限制广播地址。对本机来说,这个地址指本网段内(同一广播域)的所有主机
    • 127.0.0.1~127.255.255.254
      • 本机回环地址,主要用于测试。在传输介质上永远不应该出现目的地址为“127.0.0.1”的 数据包
    • 224.0.0.0到239.255.255.255
      • 组播地址,224.0.0.1特指所有主机,224.0.0.2特指所有路由器。224.0.0.5指OSPF 路由器,地址多用于一些特定的程序以及多媒体程序
    • 169.254.x.x
      • 如果Windows主机使用了DHCP自动分配IP地址,而又无法从DHCP服务器获取地址,系统会为主机分配这样地址

    子网掩码

    子网掩码1

    网络号扩展8位:
    子网掩码2

    子网掩码的八位对应

    128 64 32 16 8 4 2 1 netmask
    1 0 0 0 0 0 0 0 128
    1 1 0 0 0 0 0 0 192
    1 1 1 0 0 0 0 0 224
    1 1 1 1 0 0 0 0 240
    1 1 1 1 1 0 0 0 248
    1 1 1 1 1 1 0 0 252
    1 1 1 1 1 1 1 0 254
    1 1 1 1 1 1 1 1 255

    网络号与主机号计算

    将IP地址和子网掩码相与,结果即为网络号
    子网掩码的0位对应IP的位数,即为主机号

    一个网络内最多有多少主机,使用2的子网掩码0位数的次方-2即可算出
    需要划分多少子网,需要的情况下,

    跨网络通信

    • 跨网络通信:路由
    • 路由分类:
      • 主机路由
      • 网络路由
      • 默认路由
    • 优先级:精度越高,优先级越高

    动态主机配置协议dhcp

    子网掩码2

    动态请求地址

    基本网络配置

    • 将Linux主机接入到网络,需要配置网络相关设置
    • 一般包括如下内容:
      • 主机名
      • IP/netmask
      • 路由:默认网关
      • DNS服务器
        • 主DNS服务器
        • 次DNS服务器
        • 第三DNS服务器

    CentOS 6网卡名称:

    • 接口命名方式:CentOS 6
      • 以太网:eth[0,1,2,...]
      • ppp:ppp[0,1,2,...]
    • 网络接口识别并命名相关的udev配置文件:
      • /etc/udev/rules.d/70-persistent-net.rules
    • 查看网卡:
      • dmesg |grep –i eth
      • ethtool -i eth0
    • 卸载网卡驱动:
      • modprobe -r e1000
      • rmmod e1000
    • 装载网卡驱动:
      • modprobe e1000

    网络配置方式

    • 静态指定:
      • ifconfig, route, netstat
      • ip: object {link, addr, route}, ss, tc
      • system-config-network-tui,setup
      • 配置文件
    • 动态分配:
      • DHCP: Dynamic Host Configuration Protocol

    配置网络接口

    • ifconfig命令
      • ifconfig [interface]
      • ifconfig -a
      • ifconfig IFACE [up|down]
      • ifconfig interface [aftype] options | address ...
      • ifconfig IFACE IP/netmask [up]
      • ifconfig IFACE IP netmask NETMASK
      • 注意:立即生效
      • 启用混杂模式:[-]promisc
  • 相关阅读:
    fileupload的乱码解决
    关于WEB-INF文件夹中的内容
    复习,关于server.xml的一点理解
    使用eclipse kepler,结果getServletContext可用了
    拷贝内容到eclipse中导致JSP的auto-completion不工作
    eclipse新建tomcat server但是总是报404的解决方法
    flex 自定义事件
    flex TweenLite
    flex 坐标系
    flex DataGroup
  • 原文地址:https://www.cnblogs.com/kjalbert/p/11731312.html
Copyright © 2011-2022 走看看