物理网络层一般要限制每次发送数据帧的最大长度。任何时候IP层接受到一份要发送的IP数据报时,它要判断向本地哪个接口发送数据(选路),并查询该接口获得其MTU(最大传输单元:Maximum Transmission Unit,通常与通信接口有关,单位:字节)。IP把MTU与数据报长度进行比较,如果需要则进行分配。分片可以发生在原始发送端主机上,也可以发生在中间路由器上。
把一份IP数据包分片以后,只有到达目的地才进行重新组装(这里的重新组装与其他网络协议不同,他们要求在下一站就进行重新组装,而不是在最终的目的地)。重新组装由目的端的IP层来完成,其目的是使分片和重新组装过程对运输层(TCP和UDP)是透明的。已经分片过的数据报有可能会再次进行分片(可能不止一次)。IP首部中包含的数据为分片和重新组装提供了足够的信息。
对于发送端发送的每份IP数据报来说,其标识字段都包含一个唯一值。该值在数据报分片时被复制到每个片中。标志字段用其中一个比特来标示“更多的片”。除了最后一片,其他每一组成数据报的片都要把该比特置为1.片偏移字段指的是该片偏移原始数据报开始处的位置。另外,当数据报被分片后,每个片的总长度值要改为该片的长度值。
最后,标志字段中有一个比特称作“不分片”位。如果将这一比特置1,IP将不对数据报进行分片。相反把数据报丢弃并发送一个ICMP差错报文给起始端。
当IP数据报被分片后,每一片都成为一个分组,具有自己的IP首部,并在选择路由时与其他分组独立。这样,当数据报的这些片到达目的端时有可能会丢失,但是在IP首部中有足够的信息让接收端能正确组装这些数据报片。
尽管IP分片过程看起来是透明的,但有一点让人不想使用它:即使只丢失一片数据也要重传整个IP数据报。为什么会发生这种情况呢?因为IP层本身没哟超时重传的机制--由更高层来负责超时和重传(TCP有超时和重传机制,但UDP没有)。当来自TCP报文段的某一片丢失后,TCP在超时后会重发整个TCP报文段,该报文段对应于一份IP数据报。没有办法只重传数据报中的一个数据报片。事实上,如果对数据报分片的是中间路由器,而不是起始端系统,那么起始端系统就无法知道数据报是如何被分片的。就这个原因,经常要避免分片。
使用UDP很容易导致IP分片,而TCP试图避免分片(但对于应用程序来说几乎不可能强迫TCP发送一个需要进行分片的长报文段)。
在一个以太网上,数据帧的最大长度是1500字节,其中1472字节留给数据,假定IP首部为20字节,UDP首部为8字节。
例如,分别以数据长度为1471,1472,1473和1474字节运行sock程序,最后两次应该发生分片:
(1)前两份UDP数据报能装入以太网数据帧,没有被分配。,但是对应于写1473和1474字节的IP数据报长度为1501和1502,就必须进行分片。
(2)当IP数据报被分片后,frag 26304和frag 26313指的是IP首部中标示字段的值,冒号和@号之间的1480是除IP首部外的片长。两份数据报第一片的长度均为1480:UDP首部8字节,用户数据1472字节(加上IP首部20字节正好为1500字节)。
(3)第一份数据报的第2片只包含1字节数据,第二份数据报的第2片只包含2字节的数据。
(4)位于@后的数字是从数据报开始处计算的片偏移值。跟在偏移值后面的加号对应于IP首部中3bit标志字段中的“更多片”比特。设置这一比特的目的是让接收端知道什么时候完成所有的分片组装。
(5)注意4和6行省略了协议名UDP,源端口和目的端口号协议名可以打印出来,因为它在IP首部并被复制到各个片中,但是,端口号在UDP首部,只能在第1片中被发现。任何运输层首部只出现在第一片数据中。
在分片时,除了最后一片外,其他每一片中的数据部分(除了IP首部外的其他部分)必须是8字节的整数倍。
IP数据报时指IP层端到端的传输单元(在分片之前和重新组装之后),分组是指IP层和链路层之间传送的数据单元。一个分组可以使一个完整的IP数据报,也可以是IP数据报的一个分片。