作为一个Web测试工程师,对HTTP协议还是需要一定的了解的,对其请求模型和头信息进行了学习,总结如下:
HTTP请求模型
一、连接至Web服务器
一个客户端应用(如Web浏览器)打开到Web服务器的HTTP端口的一个套接字(缺省为80)。
例如:http://www.myweb.com:8080/index.html
在Java中,这将等同于代码:
Socket socket=new Socket("www.myweb.com",8080);
InputStream in=socket.getInputStream();
OutputStream out=socket.getOutputStream();
二、发送HTTP请求
通过连接,客户端写一个ASCII文本请求行,后跟0或多个HTTP头标,一个空行和实现请求的任意数据。一个请求由四个部分组成:请求行、请求头标、空行和请求数据。
1、请求行:请求行由三个标记组成:请求方法、请求URI和HTTP版本,它们用空格分隔。
例如:GET /index.html HTTP/1.1
HTTP规范定义了8种可能的请求方法:
- GET //检索URI中标识资源的一个简单请求
- HEAD //与GET方法相同,服务器只返回状 态行和头标,并不返回请求文档
- POST //服务器接受被写入客户端输出流中的数据的请求
- PUT //服务器保存请求数据作为指定URI新 内容的请求
- DELETE //服务器删除URI中命名的资源的请求
- OPTIONS //关于服务器支持的请求方法信息的请求
- TRACE //Web服务器反馈Http 请求和其头标的请求
- CONNECT //已文档化但当前未实现的一个方法,预留做隧道处理
2、请求头标:由关键字/值对组成,每行一对,关键字和值用冒号(:)分隔。
请求头标通知服务器有关于客户端的功能和标识,典型的请求头标有:
- User-Agent //客户端厂家和版本,eg:Mozilla /5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3
- Accept //客户端可识别的内容类型列表,eg:text /html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
- Accept-Language //接收语言,eg:zh- cn,zh;q=0.5
- Accept-Encoding //接收压缩方式,eg:gzip,deflate
- Accept-Charset //接收编 码,eg:GB2312,utf-8
- Keep-Alive //客户端到服务器端的连接持续有效
- Connection //链接方式,eg:keep-alive
- Cookie //
- Cache-Control //控制HTTP缓存
- Referer //请求的来源页面
- Host //请求主机
- Authorization //页面验证
- //POST时
- Content-Type //数据或文件的类型
- Content-Length //附加到请求的数据字节数
3、空行:最后一个请求头标之后是一个空行,发送回车符和退行,通知服务器以下不再有头标。
4、请求数据:使用POST传送数据,最常使用的是Content-Type和Content-Length头标。
三、服务端接受请求并返回HTTP响应
Web服务器解析请求,定位指定资源。服务器将资源副本写至套接字,在此处由客户端读取。
一个响应由四个部分组成;状态行、响应头标、空行、响应数据
1、状态行:状态行由三个标记组成:HTTP版本、响应代码和响应描述。
HTTP版本:向客户端指明其可理解的最高版本。
响应代码:3位的数字代码,指出请求的成功或失败,如果失败则指出原因。
响应描述:为响应代码的可读性解释。
例如:HTTP/1.1 200 OK
HTTP响应码:
1xx:信息,请求收到,继续处理
2xx:成功,行为被成功地接受、理解和采纳
3xx:重定向,为了完成请求,必须进一步执行的动作
4xx:客户端错误,请求包含语法错误或者请求无法实现
5xx:服务器错误,服务器不能完成对一种正常请求的处理
2、响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。
- Date //返回时间,eg:Thu, 15 Oct 2009 15:44:12 GMT
- Server //web服务器类型 Apache /2.0.54 (Unix)
- Last-Modified //最近更新时间 Thu, 15 Oct 2009 15:43:22 GMT
- Accept-Ranges //接收范围,eg:bytes
- X-Powered-By //使用的语言工具,eg:PHP /5.2.6
- Cache-Control //缓存控制,eg:max-age=60
- Expires //过期时 间 Thu, 15 Oct 2009 15:45:12 GMT
- Content-Encoding //页面压缩 eg:gzip
- Content-Type //返回数据类 型,eg: text/html; charset=UTF-8
- Connection //请求连接,eg:close
- Set-Cookie //The server sends the line
Set-Cookie
only if the server wishes the browser to store a cookie.Set-Cookie
is a request for the browser to store the stringname=value
and send it back in all future requests to the server.
3、空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。
4、响应数据:HTML文档和图像等,也就是HTML本身。
四、服务器关闭连接,浏览器解析响应
1.浏览器首先解析状态行,查看表明请求是否成功的状态代码。
2.然后解析每一个响应头标,头标告知以下为若干字节的HTML。
3.读取响应数据HTML,根据HTML的语法和语义对其进行格式化,并在浏览器窗口中显示它。
4.一个HTML文档可能包含其它需要被载入的资源引用,浏览器识别这些引用,对其它的资源再进行额外的请求,此过程循环多次。
五、无状态连接
HTTP模型是无状态的,表明在处理一个请求时,Web服务器并不记住来自同一客户端的请求。HTTP是一种无状态的协议,无状态是指Web浏览器和Web服务器之间不需要建立持久的连接,这意味着当一个客户端向服务器端发出请求,然后Web服务 器返回响应(response),连接就被关闭了,在服务器端不保留连接的有关信息.
如果浏览器或者服务器在其头信息加入了这行代码:Connection:keep-alive,TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立 新连接所需的时间,还节约了网络带宽。
六、实例
1.浏览器发出请求
GET /index.html HTTP/1.1
服务器返回响应:
HTTP /1.1 200 OK
Date: Apr 11 2006 15:32:08 GMT
Server: Apache/2.0.46(win32)
Content-Length: 119
Content-Type: text/html
<HTML>
<HEAD>
<LINK REL="stylesheet" HREF="index.css">
</HEAD>
<BODY>
<IMG SRC="image/logo.png">
</BODY>
</HTML>
附录知识:
1.HTTP规范:Internet工程制定组织(IETF)发布的RFC指定Internet标准,这些RFC被Internet研究发展机构广泛接 受。因为它们是标准文档,故一般用正规语言编写,如立法文标一样。
2.RFC:RFC一旦被提出,就被编号且不会再改变,当一个标准被修改时,则给出一个新的RFC。作为标准,RFC在Internet上被广泛采用。
3.HTTP的几个重要RFC:
RFC1945 HTTP 1.0 描述
RFC2068 HTTP 1.1 初步描述
RFC2616 HTTP 1.1 标准
4.资源标识符URI(Uniform Resource Identifter,URI)
5.在http 1.0的协议里定义了三种请求方式:GET,POST,HEAD。http 1.1又补充了一些,如PUT,DELETE,OPTIONS和TRACE。
6.查看HTTP请求和相应的头信息:http://web-sniffer.net/ 或者 firebug/httpwatch等工具。
参考资料:
http://www.java3z.com/cwbwebhome/article/article2/2406.html?id=1093
http://www.jgcao.com/index.php/2009/10/http-%E8%AF%B7%E6%B1%82%E7%AE%80%E4%BB%8B/
原文地址:http://www.51testing.com/index.php?uid-225738-action-viewspace-itemid-216200