什么是网络编程:
网络通常指的是计算机中的互联网。是由多台计算机通过网线或其他媒介相互链接组成的,编写基于网络的应用程序的过程称之为网络编程。
为什么学网络编程:
我们已经知道计算机由硬件操作系统,应用程序组成,有了这三个元素,就可以在自己的电脑
上运行一些应用程序了,比如玩玩纸牌,扫扫雷什么的。
C/S构架
学习网络编程就是要通过网络来访问另一台计算机的数据,这样必然需要二台计算机,一台计算机上放着要分享的数据和用于分享数据的程序,另一台计算机上运行访问数据的程序。
我们把提供数据的一方叫做服务端(server),把访问数据叫做客户端(clietnt)
网络通讯的基本要素
两台计算机要想通讯,必须要具备两个基本要素。
物理连接介质,包括网线,无线电,光纤等
通讯协议:
什么是协议:
协议就是标准,大家要遵循相同的标准才能正常交流通讯。
为什么要制定协议:
在计算机中,链接介质通常是网线,网线本质就是一条电线,可以传播电流,而电流可以按照强弱,被理解为0和1.
如何使用协议:
作为应用程序开发者,物理介质显然不是我们需要关心的,比如如何牵网线,所以通讯协议是我们学习的重点要使用通讯。
网络通讯协议:
协议是由发送方和接收方共同制定的,考虑到计算机已经发展了这么多年,所以制定的协议,
过程很显然我们没有机会参与了,要做的是了解通讯协议中的各种规定。
osi七层协议:
物理层:用物理介质链接互联网中的其他计算机
数据链路层:用MAC地址通讯,但仅限同一局域网。
网络层:用ip确定全球范围内某个局域网中的某台计算机。
传输层:用端口来确定某一计算机中的某一个进程
会话层,表示层,应用层:组织自己的数据结构
为什么需要OSI:
早期各个计算机厂商都有自己的一套网络通讯协议,但由于各不相同,导致了不同厂商的计算机之间
无法进行网络通讯。
总结:OSI 就是相当于计算机界的通用语言,只要按照OSI规定的标准来通讯,就能够与全世界任何一台所有计算机通讯。
OSI各层工作原理解析
一物理层:
物理层的功能:基于电子器件发送电流信号,根据电流的高低可以对应数字0和1,也就是二进制数据。
二.数据链路层
数据链路层的由来:单纯的电信号0和1没有任何意义,必须规定电信号多少位一组,每组什么意思。
以太网协议:
以太网协议(Ethernet)工作在数据链路层,其规定了电信号分组方式,以及一组电信号应该包含哪些内容
ethernet规定如下:
-
一组电信号构成一个数据包,叫做‘帧’
-
每一数据帧分成:报头head和数据data两部分
head包含:(固定18个字节)
- 发送者/源地址,6个字节
- 接收者/目标地址,6个字节
- 数据类型(标签+以太类型),6个字节
data包含:(最短46字节,最长1500字节)
- 数据包的具体内容
head长度+data长度=最短64字节,最长1518字节,超过最大限制就分片发送
mac地址:
head中包含的源和目标地址指的是什么地址呢?
ethernet规定接入internet的设备都必须具备网卡,发送端和接收端的地址便是指网卡的地址,即mac地址
mac地址:每块网卡出厂时都被烧制上世界唯一的MAC地址,长度为48位二进制,通常由12位16进制数表示。
广播:
有了mac地址,同一网络内的两台主机就可以通信了
ethernet采用最原始的方式,广播的方式进行通信,即计算机通信基本靠吼
广播有什么问题吗?如果这个网络中有100台电脑,大家都在同一时间都在互相通讯,那是什么情况,
相当于村头挂着100个大喇叭,大家都在使劲喊,结果是要听清楚说的什么内容非常费劲儿
回到计算机中,100台电脑都在那儿广播,传输速度一定是有限的,严重浪费了网络资源
所以,处在局域网中间的设备即交换机(上图的中间那个小东西)
交换机不仅负责让网络中的计算机能够互相通信,还要优化网络传输,
如何优化呢?
当pc1想要与pc2通讯前
1.需要知道pc2的MAC地址,所以必须先将这个信息广播给所有的计算机,
2.这个信息必须先交给交换机,再由交换机广播出去,
3.pc2收到消息消息后发现目标MAC是自己,就回复数据给发送方,
4.而回复也必须先交给交换机,此时交换机就会记录pc2的MAC地址与网口号的对应关系存到自己的缓存中,
5.下一次在要给pc2发数据时从缓存中查找pc2的MAC地址,
6.如果找到了就直接单独给pc2发送,不在需要广播,
7.如果没有则重复之前的广播过程
这一优化功能称之为自动学习功能
三.网络层
1.网络层由来:
有了ethernet、mac地址、广播的发送方式,世界上的计算机就可以彼此通信了
2.以太网通讯存在的问题:
世界范围的互联网是由一个个彼此隔离的小的局域网组成的,如果所有的计算机都采用以太网的广播方式来寻找其他计算机,那么一台机器发送的包全世界都会收到,这就不仅仅是效率低的问题了,这会是一种灾难,(广播风暴就是这么产生的)
结论:必须找出一种方法来区分哪些计算机属于同一广播域,哪些不是,如果是就采用广播的方式发送,如果不是,就采用路由的方式(向不同广播域/子网分发数据包),mac地址是无法区分的,它只跟厂商有关;
网络层功能:引入一套新的地址用来区分不同的广播域/子网,这套地址即网络地址,网络地址到底长什么样,又是如何区分子网的?
3.IP协议
IP协议是工作在网络层的协议,全称:Internet Protocol Address,翻译为互联网协议地址
四.传输层(重点)
传输层的由来:
通过物理层简历链接通道
通过数据链路层的MAC,可以定位到某个局域网中的某台主机,
通过网络层的IP地址,子网掩码,可以定位到全球范围某一局域网下的某台主机
那么问题来了:
一台计算机上是不可能只运行一个应用程序的,比如同时登陆qq和微信,那接收到的数据到底是交给微信还是qq呢?
答案就是:端口号,端口是需要联网的应用程序与网卡关联的编号
传输层功能:建立端口到端口的通信
补充:端口范围0-65535,0-1023为系统占用端口
TCP与UDP是工作在传输层的协议:
TCP协议
可靠传输,TCP数据包没有长度限制,理论上可以无限长,但是为了保证网络的效率,通常TCP数据包的长度不会超过IP数据包的长度,以确保单个TCP数据包不必再分割。
TCP之所以可靠,是因为在传输数据前需要三次握手确认建立链接
三次握手:
三次握手的过程实际上实在确认我发的你能收到,你发的我也能收到,从而保证数据传输的的可靠性,
链接是一个虚拟的概念,不实际存在,只要三次握手成功即表示连接建立成功!
问题是三次握手时的确能保障数据传输是可靠的,那么握手后的数据传输要如何保证传输成功呢?
TCP协议要求在发送数据后,必须接收到对方的回复信息才能确认数据成功发送,如果一段时内没有收到回复信息,会自动重新发送,如果重试的次数过多则表示链接可能已经中断!
四次挥手:
四次挥手的目的是保证双方的数据传输已经全部完成,同样是为了保证数据的完整性
总结
其优点很明显:能够保证数据传输是完整的
缺点:由于每次都需要传输确认信息,导致传输效率降低
场景:多用于必须保证数据完整性的场景,例如文本信息,支付信息等!
UDP协议
不可靠传输,”报头”部分一共只有8个字节,总长度不超过65,535字节,正好放进一个IP数据包。
UDP协议采取的方式与TCP完全不同,其根本不关心,对方是否收到数据,甚至不关心,对方的地址是否有效,只要将数据报发送到网络,便什么都不管了!
总结
优点:由于不需要传输确认信息,所以传输效率高于TCP协议
缺点:传输数据可能不完整
场景:视频聊天,语音聊天等,不要求数据完整性,但是对传输速度要求较高