- 网络通信原理
- 网络通信实现
- 网络通信流程
一、网络通信原理
首先来复习下操作系统。
什么是操作系统?操作系统就是管理和控制计算机硬件和软件资源的计算机程序。任何其他软件都必须在操作系统下才能运行。
1.1互联网的本质
一台计算机装上了操作系统,再装上软件就可以使用了。但是也只有你自己使用,那么如何要大家一起交流玩耍呢?
那么只要大家都把自己的计算机接入到互联网(internet)中,就可以互相通信了。
那么人与人之间的交流,有语言的标准。计算机与计算机之间的交流肯定也需要标准。
计算机之间一系列的标准称之为互联网协议。
互联网的本质就是一系列的协议,总称为“互联网协议”。
互联网协议的功能:定义计算机如何接入internet,以及接入internet的计算机通信的标准。
1.2OSI七层协议
互联网协议按照功能不同分为OSI七层协议或者TCP/IP五层协议或者TCP/IP四层协议。
每层常见的物理设备:
1.3TCP/IP五层模型讲解
TCP/IP五层协议是把七层协议中的应用层、表示层、会话层合并成为了应用层。
每层都运行特定的协议,越往上越靠近用户,越往下越靠近硬件。
1.3.1物理层
物理层的功能:主要是基于电器特性发送高低电压(电信号),高电压对应数字为1,低电压对应数字为0.
1.3.2数据链路层
数据链路层的功能:最基本的服务是将源自网络层来的数据可靠地传输到相邻节点的目标机网络层。
以太网协议:早期的时候各个公司都有自己的分组方式,后来形成了统一的标准,即以太网协议ethernet
ethernet规定
一组电信号构成一个数据包,叫做‘帧’ 每一数据帧分成:报头head和数据data两部分
head包含:(固定18个字节)
发送者/源地址,6个字节
接收者/目标地址,6个字节
数据类型,6个字节
data包含:(最短46字节,最长1500字节)
数据包的具体内容:
head长度+data长度=最短64字节,最长1518字节,超过最大限制就分片发送
mac地址:
head中包含的源和目标地址由来:ethernet规定接入internet的设备都必须具备网卡,发送端和接收端的地址便是指网卡的地址,即mac地址
mac地址:每块网卡出厂时都被烧制上一个世界唯一的mac地址,长度为48位2进制,通常由12位16进制数表示(前六位是厂商编号,后六位是流水线号)
广播:
有了mac地址,同一网络内的两台主机就可以通信了(一台主机通过arp协议获取另外一台主机的mac地址)
ethernet采用最原始的方式,广播的方式进行通信,即计算机通信基本靠吼
1.3.3网络层
有了以太网协议、mac地址和广播的发送方式,世界上的计算机就可以通信了。
但是,世界上的计算机是由一个个小的彼此隔离的局域网组成的,如果通信采用广播的方式,那么一台计算机发送的包世界上的计算机都会收到,这就不仅仅是效率的问题了,可能会引发世界性的灾难。
所以要如何区分哪台计算机属于同一广播地址,哪些不是呢?
所以网络层引进了一种新的地址来区分不同的广播域,这套地址就是网络地址。
IP协议:规定网络地址的协议叫IP协议,它定义的地址称之为IP地址。
常见的IP地址分为:IPV4和IPV6两种。
IP地址编址方案将IP地址空间划分为A、B、C、D、E五类,其中A、B、C是基本类,D、E类作为多播和保留使用。
IP地址分为两部分:网络部分和主机部分。
子网掩码:所谓”子网掩码”,就是表示子网络特征的一个参数。它在形式上等同于IP地址,也是一个32位二进制数字,它的网络部分全部为1,主机部分全部为0。
IP协议的作用:一个是为每一台计算机分配IP地址,另一个是确定哪些地址在同一个网络里。
IP数据包:也分为head和date两部分。它整个会被封装在以太网协议的"数据"部分。
ARP协议:即地址解析协议,是一个根据IP地址获取物理地址的一个协议。
功能:广播的方式发送数据包,获取目标主机的mac地址。
1.3.4传输层
功能:建立端口到端口的通信。 端口范围:0~65535,其中0~1023为系统占用端口。
TCP协议(传输控制协议):是一种面向连接的、可靠的、基于字节流的传输层通信协议。
UDP协议(用户数据报协议):是一种无连接的、不可靠的传输层协议。
位码即tcp标志位,有6种标示:
SYN(synchronous建立联机)
ACK(acknowledgement 确认)
PSH(push传送)
FIN(finish结束)
RST(reset重置)
URG(urgent紧急)
Sequence number(顺序号码)
Acknowledge number(确认号码)
TCP三次握手:
(1)第一次握手:Client将标志位SYN置为1,随机产生一个值seq=x,并将该数据包发送给Server,Client进入SYN_SENT状态,等待Server确认。
(2)第二次握手:Server收到数据包后由标志位SYN=1知道Client请求建立连接,Server将标志位SYN和ACK都置为1,ack=x+1,随机产生一个值seq=y,并将该数据包发送给Client以确认连接请求,Server进入SYN_RCVD状态。
(3)第三次握手:Client收到确认后,检查ack是否为x+1,ACK是否为1,如果正确则将标志位ACK置为1,ack=y+1,并将该数据包发送给Server,Server检查ack是否为y+1,ACK是否为1,如果正确则连接建立成功,Client和Server进入ESTABLISHED状态,完成三次握手,随后Client与Server之间可以开始传输数据了。
TCP四次挥手:
(1)第一次挥手:Client发送一个FIN,用来关闭Client到Server的数据传送,Client进入FINWAIT1状态。
(2)第二次挥手:Server收到FIN后,发送一个ACK给Client,确认序号为收到序号+1(与SYN相同,一个FIN占用一个序号),Server进入CLOSE_WAIT状态。
(3)第三次挥手:Server发送一个FIN,用来关闭Server到Client的数据传送,Server进入LAST_ACK状态。
(4)第四次挥手:Client收到FIN后,Client进入TIME_WAIT状态,接着发送一个ACK给Server,确认序号为收到序号+1,Server进入CLOSED状态,完成四次挥手。
为什么连接的时候是三次握手,关闭的时候却是四次握手?
答:因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN+ACK报文。其中ACK报文是用来应答的,SYN报文是用来同步的。但是关闭连接时,当Server端收到FIN报文时,很可能并不会立即关闭SOCKET,所以只能先回复一个ACK报文,告诉Client端,"你发的FIN报文我收到了"。只有等到我Server端所有的报文都发送完了,我才能发送FIN报文,因此不能一起发送。故需要四步握手。
1.3.5应用层
应用层是开放系统的最高层,是直接为应用进程提供服务的。
作用:规定应用程序的数据结构。
发送一个数据,从最顶层到最后封装的过程:
1.3.6socket
什么是socket?
socket是在应用层和传输层之间的一个抽象层,它把TCP/IP层复杂的操作抽象为几个简单的接口供应用层调用已实现进程在网络中通信。
网络上的两个程序通过一个双向的通信连接实现数据的交换,这个连接的一端称为一个socket。
socket本质是编程接口(API),对TCP/IP的封装,TCP/IP也要提供可供程序员做网络开发所用的接口,这就是Socket编程接口。
二、网络通信实现
要想实现网络通信,首先一台计算机需要具备下面四个要素:
- 本机的IP地址。
- 子网掩码
- 网关的IP地址
- DNS的IP地址
获得这四个要素可以通过两种方式获得:
1.静态获取。
即手动配置。
2.动态获取
即通过DHCP获取。
广播发送一个包。
最前面的”以太网标头”,设置发出方(本机)的MAC地址和接收方(DHCP服务器)的MAC地址,
后面的”IP标头”,设置发出方的IP地址和接收方的IP地址。这时,对于这两者,本机都不知道。于是,发出方的IP地址就设为0.0.0.0,接收方的IP地址设为255.255.255.255。
最后的”UDP标头”,设置发出方的端口和接收方的端口。这一部分是DHCP协议规定好的,发出方是68端口,接收方是67端口。
当看到发出方IP地址是0.0.0.0,接收方是255.255.255.255,于是DHCP服务器知道”这个包是发给我的”,而其他计算机就可以丢弃这个包。
DHCP服务器会返回一个DHCP响应数据包,结构类似:
以太网标头的MAC地址是双方的网卡地址
IP标头的IP地址是DHCP服务器的IP地址(发出方)和255.255.255.255(接收方)
UDP标头的端口是67(发出方)和68(接收方),分配给请求端的IP地址和本网络的具体参数则包含在Data部分。
新加入的计算机收到这个响应包,于是就知道了自己的IP地址、子网掩码、网关地址、DNS服务器等等参数。
三、通信流程的实现
1、本机获取。
- 本机IP地址:
- 子网掩码:
- 网关的IP地址:
- DNS的IP地址:
2、打开浏览器,想访问网易首页,在地址栏里输入www.baidu.com
3、打开网页的实现流程。
- 本地的请求发送到本地DNS服务器。
- 如果本地DNS服务器有这个网址的信息,就会返回给本机,如果没有就会向DNS根服务器发送请求。
- DNS根服务器会解析这个请求的网址,给本地DNS返回相关信息,让本地DNS向.com域名服务器发起请求。
- .com域名服务器检索信息,返回给本地DNS服务器,告诉它去访问.baidu.com域服务器。
- 找到负责www.baidu.com的域服务器,将相关信息如IP地址,返回给本地DNS服务器。
- 本地DNS服务器记录下相关信息后返回给本机。
- 本机的浏览器上就显示出了www.baidu.com的首页。
13台根服务器的位置:
A.root-servers.net198.41.0.4美国
B.root-servers.net192.228.79.201美国(另支持IPv6)
C.root-servers.net192.33.4.12法国
D.root-servers.net128.8.10.90美国
E.root-servers.net192.203.230.10美国
F.root-servers.net192.5.5.241美国(另支持IPv6)
G.root-servers.net192.112.36.4美国
H.root-servers.net128.63.2.53美国(另支持IPv6)
I.root-servers.net192.36.148.17瑞典
J.root-servers.net192.58.128.30美国
K.root-servers.net193.0.14.129英国(另支持IPv6)
L.root-servers.net198.32.64.12美国
M.root-servers.net202.12.27.33日本(另支持IPv6)
4.HTTP部分的内容,类似于下面这样:
GET / HTTP/1.1
Host: www.163.com
.....
我们假定这个部分的长度为4960字节,它会被嵌在TCP数据包之中。
5.TCP协议
TCP数据包需要设置端口,接收方(Google)的HTTP端口默认是80,发送方(本机)的端口是一个随机生成的1024-65535之间的整数,假定为51775。
TCP数据包的标头长度为20字节,加上嵌入HTTP的数据包,总长度变为4980字节。
6.IP协议
然后,TCP数据包再嵌入IP数据包。IP数据包需要设置双方的IP地址,这是已知的,发送方是192.168.1.100(本机),接收方是172.194.72.105(Google)。
IP数据包的标头长度为20字节,加上嵌入的TCP数据包,总长度变为5000字节。
7.以太网协议
最后,IP数据包嵌入以太网数据包。以太网数据包需要设置双方的MAC地址,发送方为本机的网卡MAC地址,接收方为网关192.168.1.1的MAC地址(通过ARP协议得到)。
以太网数据包的数据部分,最大长度为1500字节,而现在的IP数据包长度为5000字节。因此,IP数据包必须分割成四个包。因为每个包都有自己的IP标头(20字节),所以四个包的IP数据包的长度分别为1500、1500、1500、560。
8.服务器端响应
经过多个网关的转发,Google的服务器172.194.72.105,收到了这四个以太网数据包。
根据IP标头的序号,Google将四个包拼起来,取出完整的TCP数据包,然后读出里面的”HTTP请求”,接着做出”HTTP响应”,再用TCP协议发回来。
本机收到HTTP响应以后,就可以将网页显示出来,完成一次网络通信。