zoukankan      html  css  js  c++  java
  • http协议(一)基础知识

    我自己写的随笔一般是偏学习笔记性质的,或者一点个人理解,适合新人,大牛可以忽略这个。。。。。。

    参考书籍——《图解http》

    当我们在浏览器的地址栏中输入网址,然后点击回车,接着,浏览器就会呈现出我们需要的web界面,那么,这个界面是怎么产生的?

    web的界面是根据我们输入的URL(网址、地址),浏览器从服务器端获取对应的文件资源等信息,然后显示在浏览器上面。

    像这种通过发送请求获取服务器资源的web浏览器等,都可以称之为客户端(client)

    web使用http(超文本传输协议)协议作为规范,来完成从客户端到服务端等一系列的运作流程,而协议指的就是规则的约定,可以说,web是建立在http协议上进行通信的

    关于http的产生和发展,这里就不赘述了,有兴趣的童鞋可以百度。。。。。。

    为了理解http,有必要简单介绍下tcp/ip协议族

    计算机与网络设备之间互相通信,双方就必须基于同样的方法。比如:如何发现通信目标、由谁发起通信、使用什么语言通信、怎么结束通信都需要事先确定,所有这些都需要一种规则,

    这就是协议。协议中存在多种的内容;从电缆的规格到ip地址的选定方法,寻找异地用户的方法,建立通信的顺序,以及web页面显示需要处理的步骤等等

    像这样把与互联网相关联的协议集合起来统称为tcp/ip

    tcp/ip的分层

    tcp/ip很重要的一个特点就是分层。按照层次分为以下四层:应用层,传输层,网络层和数据链路层

    分层的好处:如果互联网只由一个协议统筹,那么某一地方出问题,整体都会出现问题,无法使用;分层后,只需替换出现问题的或者需要修改的即可,而且分层后针对具体的设计也变得更为简单

    应用层:体系的最高层,应用进程间通信交互的规则

    tcp/ip协议族预存了各类通用的应用服务,比如:

    ftp:文件传输协议

    dns:域名系统协议

    http:万维网应用协议

    smtp:电子邮件协议

    以上几种是常用的几种,还有很多其他的协议,感兴趣的可以找找其他专业的书籍看看

    传输层:提供处于网络连接中的两台计算机间的数据传输,其中包括tcp和udp两种性质不同的协议

    tcp:传输控制协议,传输的单位为报文段,提供面向连接的,可靠的数据传输服务

    udp:传输单位为用户数据报,它是尽最大努力的提供数据传输服务,不保证可靠性

    网络层:又名网络连接层

    用来处理在网络上流动的数据包(封装)。数据包是网络传输的最小数据单位。该层规定了通过怎样的路径到达对方计算机并把数据包传给对方

    链路层:又名数据链路层,网络接口层

    处理连接网络的硬件部分。比如控制操作系统、硬件的驱动、网络适配器、光钎等

    数据的封装

    用户端发送一个请求,从应用层开始,一直到链路层,每一层都会被打上该层所属的首部信息;反之,接收端在层与层之间传输时,每经过一层会去掉该层的首部信息,这种做法叫做封装

    与http密切相关的协议

    IP协议:位于网络层,作用是把各种数据包传送给对方,而要准确的把数据传送给对方,就需要满足各类条件,其中有2个很重要的条件:ip地址和mac地址

    ip地址相信有点基础的人都知道,就是节点被分配到的地址,mac地址则是指网卡所属的固定地址,ip和mac地址可以进行配对

    ip间的通信依赖于mac地址,在信息传输中,有时候由于中转太多,因此会采用ARP协议,这是个用来解析地址的协议,通过ip地址就可以反查出对应的mac地址

    tcp协议:位于传输层,确保传输的可靠性

    数据传输中为了传输方便,会将大块数据分割成报文段,而tcp协议能确认数据最终是否传送给对方

    为了准确传输,传输中采用了三次握手策略(这种手段可以理解为多次确认,来确保数据传输的可靠性)

    dns协议:负责域名解析,位于应用层,提供域名到ip地址间的解析

    通过域名查找ip地址,或者逆向从ip地址反查域名

    URL和URI

    URL:统一资源定位符:表示资源的地点,具体指向(门牌号)

    URI:统一资源标识符:用字符串标识某些互联网资源(该门牌号的地方具体有什么资源)

    URL是URI的子集

    测试之路,慢慢其修远兮
  • 相关阅读:
    爬虫-基于scrapy-redis两种形式的分布式爬虫
    爬虫-Scrapy框架(CrawlSpider)
    爬虫-User-Agent和代理池
    爬虫-scrapy框架之递归解析和post请求
    爬虫-scrapy数据的持久化存储
    爬虫-scrapy框架简介和基础应用
    爬虫-移动端数据爬取
    爬虫-图片懒加载技术、selenium和PhantomJS
    爬虫-验证码处理
    爬虫-requests模块
  • 原文地址:https://www.cnblogs.com/zhengyao9236/p/11583762.html
Copyright © 2011-2022 走看看