四、 http协议之请求
1、http请求由三部分组成,分别是:请求行(request line)、请求报头(request header)、请求正文(body)
(1)、 请求行:用来说明请求类型、要访问的资源以及使用的http版本
(2)、请求报头:用来说明服务器要使用的附加信息
(3)、正文:和header之间要有一个空行,可添加任意的其他数据
2、常用的请求报头:
Accept:用于指定客户端接受哪些类型的信息,如:image/gif,表明客户端希望接受GIF图像格式的资源;
Accept-charset:用于指定客户端接受的字符集,如:Accept-charset:iso-8859-1,gb2312。
注:如果请求信息中没有设置这个,则缺省是默认任何字符集都可接受。
Accept-encoding:类似于Accept,用于指定可接受的内容编码。如果请求信息中没有设置这个,则缺省是默认任何字符集都可接受。
Accept-language:指定一种自然语言
Authorization:用于证明客户端有权查看某个资源。当浏览器访问一个页面时,如果收到服务器的响应代码为401(未授权),可以发送一个包含Authorization请求报头域的请求,要求服务器对其进行验证。
User-Agent:允许客户端将其操作系统、浏览器和其他属性告诉服务器。(不是必需的)
五、 http协议之响应
1、 http响应也由三部分组成,分别是:状态行(request line)、响应报头(request header)、响应正文(body)
header与body之间有空行。
Method表示请求方法(“post“或”get“),path-to-resource表示请求的资源,Http/version-number表示HTTP协议的版本号。
注意:当使用“GET”方法的时候,body(请求数据)为空!如下图所示:
状态代码有三位数字组成,第一个数字定义了响应的类别,有5种可取值:
1xx:指示信息,表示请求已接收,继续处理;
2xx:成功,表示请求已被成功接收、理解、接受;
3xx:重定向,要完成请求必须进行更进一步的操作;
4xx:客户端错误,请求有语法错误或请求无法实现;
5xx:服务器端错误,服务器未能实现合法的请求。
2、 常见状态码、状态描述、说明
200:OK //客户端请求成功
400:Bad Request //客户端请求有语法错误,不能被服务器所理解
401:Unauthorized //请求未经授权,这个状态码必须和www-Authenticate报头域一起使用
403:forbidden //服务器收到请求,但是拒绝提供服务
404:not found //请求资源不存在
500:Internal Server Error //服务器发生不可预期的错误
503:Server Unavailable //服务器当前不能处理客户端的请求,一段时间后可能恢复正常。
3、 常见的响应报头
Server:指定服务器名称,包含了处理请求的服务器使用的软件产品信息。与User-Agent请求报头域是相对应的;
Location:重定向请求者到一个新的URL地址。常用在更换域名的时候;
Allow:指出服务器所支持的请求方式,如GET、POST等方法;
Content-Encoding:指定文档的编码方法;
Content-Length:指定响应中数据的字节长度;
Date:指定发送http消息的日期;
Last-Modified:指定返回数据的最后修改时间;
Refresh:指定浏览器定时刷新的时间;
Content-Type:指定回送数据的MIME类型。
六、HTTP Request header(以Fiddler工具为例)
使用fiddler工具能很方便的查看request header(请求报头),如下图所示:
(1)Client头域:包含了一些常见的请求报头:
a) Accept:
作用:浏览器端可以接受的媒体类型
例如:Accept: text/html 代表浏览器可以接受服务器返回的类型为text/html,即html文档。如果服务器无法返回text/html类型的数据,服务器应该返回一个406错误。通配符*代表任意类型,例如:Accept: */* 代表浏览器可以处理所有类型(一般浏览器发给服务器都是发这个)
b) Accept-encoding:
作用:浏览器申明自己接收的编码方法,通常指定压缩方法,是否支持压缩,支持什么压缩方法(gzip,deflate),例如:Accept-encoding: gzip,deflate
c) Accept-language
作用:浏览器申明自己接收的语言(语言跟字符集的区别:中文是语言,中文有多种字符集,比如big5,gb2312,gbk等等)
例如:Accept-language: en-us
d) User-agent:
作用:告诉http服务器,客户端使用的操作系统和浏览器的名称和版本。
例如:User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.87 Safari/537.36
e) Accept-charset:
作用:浏览器申明自己接收的字符集,这就是前面介绍的字符集和字符编码,如:gb2312,utf-8
(2)Cookie/login头域
作用:最重要的header,将cookie的值发送给HTTP服务器
(3)Miscellaneous头域
Referer:提供了request的上下文信息的服务器,告诉服务器是从哪个链接过来的。比如从某个主页上链接到一个朋友那里,它的服务器就能够从HTTP Referer中统计出每天有多少用户点击主页上的链接访问它的网站。
(4)Transport头域
Connection:
Connection:keep-alive 当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接。
Connection:close 代表一个request完成后,客户端和服务端之间用于传输HTTP数据的TCP连接会关闭,当客户端再次发送request,需要重新建立TCP连接。
Host:发送请求时,该报头域是必须的
作用:主要用于指定被请求资源的Internet主机和端口号,他通常从HTTP URL中提取出来的。例如:在浏览器中输入http://192.168.1.xx:2400/province/,浏览器发送的请求消息中,就包含Host请求报头域,如下:
三、 HTTP Response header
同样使用Fiddler查看Response header,如下图:
(1)Cache头域
Date:作用生成消息的具体时间和日期
例如: Date: Tue, 20 Dec 2016 06:39:15 GMT
Vary:
(2)Entity头域
Content-Type:web服务器告诉自己响应的对象的类型和字符集
Content-Length:指明实体正文的长度,以字节方式存储的十进制数字来表示
四、 关于HTTP请求GET和POST的区别
1、 ①GET提交,请求的数据会附在URL之后(就是把数据放置在HTTP协议头<request-line>中),以?分割URL和传输数据,多个参数用&连接。例如:login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0%E5%A5%BD。如果数据是英文字母/数字,原样发送,如果是空格,转换为+,如果是中文/其他字符,则直接把字符串用BASE64加密,得出如: %E4%BD%A0%E5%A5%BD,其中%XX中的XX为该符号以16进制表示的ASCII。
②POST提交:把提交的数据放置在是HTTP包的包体<request-body>中。上文示例中红色字体标明的就是实际的传输数据。因此,GET提交的数据会在地址栏中显示出来,而POST提交,地址栏不会改变。
2、 传输数据的大小:
首先声明,HTTP协议没有对传输的数据大小进行限制,HTTP协议规范也没有对URL长度进行限制。 而在实际开发中存在的限制主要有:
①GET:特定浏览器和服务器对URL长度有限制,例如IE对URL长度的限制是2083字节(2K+35)。对于其他浏览器,如Netscape、FireFox等,理论上没有长度限制,其限制取决于操作系统的支持。 因此对于GET提交时,传输数据就会受到URL长度的限制。
②POST:由于不是通过URL传值,理论上数据不受限。但实际各个WEB服务器会规定对post提交数据大小进行限制,Apache、IIS6都有各自的配置。
3、 安全性:
POST的安全性要比GET的安全性高。注意:这里所说的安全性和上面GET提到的“安全”不是同个概念。上面“安全”的含义仅仅是不作数据修改,而这里安全的含义是真正的Security的含义,比如:通过GET提交数据,用户名和密码将明文出现在URL上,因为:
(1)登录页面有可能被浏览器缓存;
(2)其他人查看浏览器的历史纪录,那么别人就可以拿到你的账号和密码了。