zoukankan      html  css  js  c++  java
  • 互联网学习笔记(二) 互联网访问网页实例

    一.  对上一互联网学习笔记的小结

      由前一学习,我们知道,网络通信就是交换数据包。电脑A 向电脑B发送一个数据包,电脑B收到这个数据包后,回复一个数据包,从而实现两台电脑之间的通信。

      数据包的结构,基本上是下面这样:

      

      

      发送这个包,需要知道两个地址:  

        对方的 MAC 地址

        对方的 IP 地址

      有了这两个地址,数据包才能准确送到接收者手上。但是前面说过,MAC地址有局限性,如果两台电脑不在同一个子网络,就无法知道对方的MAC地址,必须通过网关(gateway)转发。

      

      上图中,1号电脑要向 4 号电脑发送一个数据包。它先判断 4 号电脑是否在同一个子网络,结果发现不是(后文介绍判断方法),于是就把这个数据包发到网关A。网关A通过路由协议,发现 4 号

    电脑位于子网络B,又把数据包发给网关B,网关B再转发到 4 号电脑。

      1号电脑把数据包发到网关A,必须知道网关A的 MAC 地址。所以,数据包的目标地址,实际上分成两种情况:

    场景 数据包地址
    同一个子网络 对方的 MAC 地址,对方的 IP 地址
    非同一个子网络 网关的 MAC 地址,对方的 IP 地址

      发送数据包之前,电脑必须判断对方是否在同一个子网络,然后选择相应的 MAC 地址。接下来,我们就来看,实际使用中,这个过程是怎么完成的。

      

    二.  用户的上网设置

      1.  静态IP设置

       你买了一台新电脑,插上网线,开机,这样就能上网了吗?

      

      通常你必须做一些设置。有时,管理员(或者ISP)会告诉你下面四个参数,你把它们填入操作系统,计算机就能连上网来了。

          本机的IP地址

          子网掩码

          网关的IP地址

          DNS的IP地址

      下图是Windows系统的设置窗口:

      这四个参数缺一不可,后文会解释为什么需要知道它们才能上网。由于它们是给定的,计算机每次开机,都会分到同样的 IP 地址,所以这种情况被称作"静态 IP 地址上网"。

      但是,这样的设置很专业,普通的用户望而生畏。而且,如果一台电脑的IP地址保持不变,其他的电脑就不能够使用这个地址,不够灵活。出于这个原因,大多数用户使用

    “动态IP地址上网”。

    2.  动态IP地址

      所谓“动态IP地址”,是指计算机开机后,会自动分配到一个IP地址,不用人为设定。它使用的协议叫做DHCP协议。

      这个协议规定,每一个子网络中,有一台计算机负责管理本网络的所有IP地址,它叫做“DHCP服务器”。新的计算机加入网络,必须向“DHCP服务器”服务器发送一个“DHCP请求”数据包,

    申请IP地址和相关的网络参数。

      前面说过,如果两台计算机在同一个子网络,必须知道对方的MAC地址和IP地址,才能发送数据包。但是,新加入的计算机不知道这两个地址怎么发送数据包呢?

      DHCP协议做了一些巧妙的规定。

    3.  DHCP协议

      首先,它是一种应用层协议,建立在UDP协议只上,所以整个数据包是这样的:

      

      (1)最前面的"以太网标头",设置发出方(本机)的 MAC 地址和接收方(DHCP 服务器)的 MAC 地址。前者就是本机网卡的 MAC 地址,后者这时不知道,就填入一个广播地址:FF-FF-FF-FF-FF-FF。

      (2)后面的“IP标头”,设置发出方(本机)的IP地址和接收方的IP地址。这时,对于这两者,本机都不知道。于是,发出方的IP地址就设为0.0.0.0,接收方的IP地址就设为255.255.255.255.

      (3)最后的“UDP标头“,设置发出方的端口和接收方的端口,这一部分是DHCP协议规定好的,发出方的端口号是68,接收方的端口号是67.

      这个数据包构造完成后就可以发出了。以太网是广播发送,同一个子网络的每一台计算机都能收到这个数据包。因为接收方的MAC地址是FF:FF:FF:FF:FF:FF,看不出是发给谁的,所以每台收到这个包的计算机,

    还必须分析这个包的IP地址,才能确定是不是发给自己的。当看到发出方的IP地址是0.0.0.0,接收方的IP地址是255.255.255.255,DHCP服务器就知道“这个包是发给我的”,而其他计算机就可以丢弃这个包了。

      接下来,DHCP服务器,读出这个包的数据内容,分配好IP地址,发送回去一个“DHCP响应”数据包,这个数据包的结构也类似。以太网标头的MAC地址是是双方的网卡地址,IP标头的IP地址,是DHCP服务器(发送方)

    的IP地址和255.255.255.255(接收方),UDP标头的端口地址是67(发出方)和68(接收方),分配给请求端的IP地址和相关的网络参数则包含在data部分。

      新加入的计算机收到这个数据包,就知道了自己的IP地址,子网掩码,网关的IP地址,DNS的IP地址等参数。

    4.  小结

      不管是静态IP地址还是动态IP地址,电脑上网的首要步骤是确定四个参数:

        本机的IP地址

        子网掩码

        网关的IP地址

        DNS的IP地址

    三.  一个例子

      下面来看看,用户访问一个网页的时候,互联网协议是如何运作的。

    1.本即参数

      假定通过上一节的介绍,用户已经设置好了自己的网络参数:

      本机的IP地址:192.168.1.100

      子网掩码:255.255.255.0

      网关的IP地址:192.168.1.1

      DNS的IP地址:8.8.8.8

      然后他打开浏览器,想访问Google,在地址栏输入了网址:www.google.com

      

      这意味着,浏览器要向 Google 发送一个网页请求的数据包。

    2.DNS  协议

      我们知道,发送数据包,必须要知道对方的IP地址,但现在我们只知道它的网址www.google.com,不知道它的IP地址。

      DNS协议可以帮助我们,把这个网址转换成IP地址。

      已知DNS服务器的IP地址是8.8.8.8,我们向这个地址发送一个DNS数据包(53端口)。

      

      然后,DNS 服务器做出响应,告诉我们 Google 的 IP 地址是 172.194.72.105。于是,我们知道了对方的 IP 地址。

    3.  子网掩码

      接下来,我们要判断,这个IP地址是不是在同一个子网络,这就要用到子网掩码。

      已知子网掩码是255.255.255.0,本机用它对自己的IP地址192.168.1.100做一个二进制的AND运算(两个位数相同,结果为1,否则为0),计算结果为192.168.1.0;然后对Google的IP地址172.195.72.105

    也做一个AND运算,计算结果为172.195.72.0。这两个结果不相等,所以本机和Google不在同一个子网络。

      因此,我们要向Google发送数据包,必须要通过网关192.168.1.1转发,也就是说,接收方的MAC地址将是网关的MAC地址。

    4.  应用层协议

      浏览网页用的是HTTP协议,它的整个数据包结构是这样的;

      

    HTTP 部分的内容,类似于下面这样:

    GET / HTTP/1.1

    Host: www.google.com

    Connection: keep-alive

    User-Agent: Mozilla/5.0 (Windows NT 6.1) ......

    Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8

    Accept-Encoding: gzip,deflate,sdch

    Accept-Language: zh-CN,zh;q=0.8

    Accept-Charset: GBK,utf-8;q=0.7,*;q=0.3

    Cookie: ... ...

      我们假定这个部分的长度为 4960 字节,它会被嵌在 TCP 数据包之中。

    5.  TCP协议

      TCP数据包需要设置端口,接收方(Google)的HTTP端口默认为80,发送方(本机)的端口是一个随机生成的1024到65535之间的整数,假定为51775.

      TCP数据包的标头默认为20字节,加上嵌入http的数据包,总长度为4980字节。

    6.  IP协议

      TCP数据包再嵌入IP数据包。IP数据包需要设置双方的IP地址,这是已知的,发送方(本机)是192.168.1.100,接收方(Google)是172.194.72.105.

      IP数据包的标头为20字节,加上嵌入的TCP数据包,总长度变为5000字节。

    7.  以太网协议

      最后,IP数据包嵌入以太网的数据包,以太网的数据包需要这只双方的MAC地址,发送方为本机的网卡MAC地址,接收方为网关192.168.1.100的MAC地址(通过ARP协议得到)。

      以太网数据包的数据部分,最大长度为1500字节,而现在的IP数据包长度为5000字节,因此,IP数据包必须分割成四个包。因为每个包都有自己的IP标头(20)字节,所以四个包的IP数据包的长度

    分别为1500,1500,1500,560

    8.  服务器端响应

      经过多个网关的转发,Google 的服务器 172.194.72.105,收到了这四个以太网数据包。

      根据 IP 标头的序号,Google 将四个包拼起来,取出完整的 TCP 数据包,然后读出里面的"HTTP 请求",接着做出"HTTP 响应",再用 TCP 协议发回来。

      本机收到 HTTP 响应以后,就可以将网页显示出来,完成一次网络通信。

      

          

      

  • 相关阅读:
    N皇后问题
    iPhone中自绘实现步骤
    ObjectiveC利用协议实现回调函数
    iphone实现双缓冲
    JAVA_内部类
    JAVA_ArrayList
    Ant入门
    JAVA_两种比较器的实现
    JAVA_继承内部类
    JAVA_序列化和反序列化
  • 原文地址:https://www.cnblogs.com/zrc-study/p/7089744.html
Copyright © 2011-2022 走看看