zoukankan      html  css  js  c++  java
  • HTTP请求模型和头信息(转)

    HTTP请求模型
    一、连接至Web服务器
    一个客户端应用(如Web浏览器)打开到Web服务器的HTTP端口的一个套接字(缺省为80)。
    例如:http://www.myweb.com:8080/index.html
    Java中,这将等同于代码:

    Socket socket=new Socket("www.myweb.com",8080);
    InputStream in=socket.getInputStream();
    OutputStream out=socket.getOutputStream();

    二、发送HTTP请求
         通过连接,客户端写一个ASCII文本请求行,后跟0或多个HTTP头标,一个空行和实现请求的任意数据。一个请求由四个部分组成:请求行、请求头标、空行和请求数据。
    1、请求行:请求行由三个标记组成:请求方法、请求URI和HTTP版本,它们用空格分隔。
    例如:GET /index.html HTTP/1.1
    HTTP规范定义了8种可能的请求方法:

    1. GET            //检索URI中标识资源的一个简单请求  
    2. HEAD            //与GET方法相同,服务器只返回状态行和头标,并不返回请求文档  
    3. POST            //服务器接受被写入客户端输出流中的数据的请求  
    4. PUT            //服务器保存请求数据作为指定URI新内容的请求  
    5. DELETE            //服务器删除URI中命名的资源的请求  
    6. OPTIONS        //关于服务器支持的请求方法信息的请求  
    7. TRACE            //Web服务器反馈Http 请求和其头标的请求  
    8. CONNECT        //已文档化但当前未实现的一个方法,预留做隧道处理 

    2、请求头标:由关键字/值对组成,每行一对,关键字和值用冒号(:)分隔。
    请求头标通知服务器有关于客户端的功能和标识,典型的请求头标有:

    1. User-Agent  //客户端厂家和版本,eg:Mozilla /5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3  
    2. Accept  //客户端可识别的内容类型列表,eg:text /html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8  
    3. Accept-Language //接收语言,eg:zh- cn,zh;q=0.5  
    4. Accept-Encoding //接收压缩方式,eg:gzip,deflate  
    5. Accept-Charset //接收编码,eg:GB2312,utf-8  
    6. Keep-Alive //客户端到服务器端的连接持续有效  
    7. Connection //链接方式,eg:keep-alive  
    8. Cookie //  
    9. Cache-Control //控制HTTP缓存  
    10. Referer //请求的来源页面  
    11. Host //请求主机  
    12. Authorization //页面验证  
    13. //POST时  
    14. Content-Type //数据或文件的类型  
    15. Content-Length    //附加到请求的数据字节数 

    3、空行:最后一个请求头标之后是一个空行,发送回车符和退行,通知服务器以下不再有头标。

    4、请求数据:使用POST传送数据,最常使用的是Content-Type和Content-Length头标。

    三、服务端接受请求并返回HTTP响应
    Web服务器解析请求,定位指定资源。服务器将资源副本写至套接字,在此处由客户端读取。
    一个响应由四个部分组成;状态行、响应头标、空行、响应数据

    1、状态行:状态行由三个标记组成:HTTP版本、响应代码和响应描述。
    HTTP版本:向客户端指明其可理解的最高版本。
    响应代码:3位的数字代码,指出请求的成功或失败,如果失败则指出原因。
    响应描述:为响应代码的可读性解释。
    例如:HTTP/1.1 200 OK
    HTTP响应码:

    1xx:信息,请求收到,继续处理
    2xx:成功,行为被成功地接受、理解和采纳
    3xx:重定向,为了完成请求,必须进一步执行的动作
    4xx:客户端错误,请求包含语法错误或者请求无法实现
    5xx:服务器错误,服务器不能完成对一种正常请求的处理

    2、响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。

    1. Date    //返回时间,eg:Thu, 15 Oct 2009 15:44:12 GMT  
    2. Server //web服务器类型   Apache /2.0.54 (Unix)  
    3. Last-Modified //最近更新时间  Thu, 15 Oct 2009 15:43:22 GMT  
    4. Accept-Ranges //接收范围,eg:bytes  
    5. X-Powered-By //使用的语言工具,eg:PHP /5.2.6  
    6. Cache-Control //缓存控制,eg:max-age=60  
    7. Expires //过期时间  Thu, 15 Oct 2009 15:45:12 GMT  
    8. Content-Encoding //页面压缩 eg:gzip  
    9. Content-Type //返回数据类型,eg:   text/html; charset=UTF-8  
    10. Connection  //请求连接,eg:close
    11. Set-Cookie //The server sends the lineSet-Cookieonly if the server wishes the browser to store a cookie.Set-Cookieis a request for the browser to store the stringname=valueand send it back in all future requests to the server.

    3、空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。

    4、响应数据:HTML文档和图像等,也就是HTML本身。

    四、服务器关闭连接,浏览器解析响应
    1.浏览器首先解析状态行,查看表明请求是否成功的状态代码。
    2.然后解析每一个响应头标,头标告知以下为若干字节的HTML。
    3.读取响应数据HTML,根据HTML的语法和语义对其进行格式化,并在浏览器窗口中显示它。
    4.一个HTML文档可能包含其它需要被载入的资源引用,浏览器识别这些引用,对其它的资源再进行额外的请求,此过程循环多次。

    五、无状态连接
    HTTP模型是无状态的,表明在处理一个请求时,Web服务器并不记住来自同一客户端的请求。HTTP是一种无状态的协议,无状态是指Web浏览器和Web服务器之间不需要建立持久的连接,这意味着当一个客户端向服务器端发出请求,然后Web服务器返回响应(response),连接就被关闭了,在服务器端不保留连接的有关信息.
    如果浏览器或者服务器在其头信息加入了这行代码:Connection:keep-alive,TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。



    六、实例
    1.浏览器发出请求
    GET /index.html HTTP/1.1

    服务器返回响应:

    HTTP /1.1 200 OK
    Date: Apr 11 2006 15:32:08 GMT
    Server: Apache/2.0.46(win32)
    Content-Length: 119
    Content-Type: text/html

    <HTML>
    <HEAD>
    <LINK REL="stylesheet" HREF="index.css">
    </HEAD>
    <BODY>
    <IMG SRC="image/logo.png">
    </BODY>
    </HTML>

    附录知识:
    1.HTTP规范:Internet工程制定组织(IETF)发布的RFC指定Internet标准,这些RFC被Internet研究发展机构广泛接受。因为它们是标准文档,故一般用正规语言编写,如立法文标一样。
    2.RFC:RFC一旦被提出,就被编号且不会再改变,当一个标准被修改时,则给出一个新的RFC。作为标准,RFC在Internet上被广泛采用。
    3.HTTP的几个重要RFC:
        RFC1945    HTTP 1.0 描述
        RFC2068    HTTP 1.1 初步描述
        RFC2616    HTTP 1.1 标准
    4.资源标识符URI(Uniform Resource Identifter,URI)
    5.在http 1.0的协议里定义了三种请求方式:GET,POST,HEAD。http 1.1又补充了一些,如PUT,DELETE,OPTIONS和TRACE。
    6.查看HTTP请求和相应的头信息:http://web-sniffer.net/  或者 firebug/httpwatch等工具。

    参考资料:
    http://www.java3z.com/cwbwebhome/article/article2/2406.html?id=1093
    http://www.jgcao.com/index.php/2009/10/http-%E8%AF%B7%E6%B1%82%E7%AE%80%E4%BB%8B/
    (http://www.51testing.com/index.php?uid-225738-action-viewspace-itemid-216200)

  • 相关阅读:
    并行 并发 概念
    为什么C++编译器不能支持对模板的分离式编译_刘未鹏
    并发编程的15 条建议
    VS2005 C++ str.Format 编译错误
    PPT 去除排练计时
    VS2005中 depends.exe 在哪里
    《A wavelet tour of signal processing》前言摘录
    Windows Forms 2.0 Programming 读书笔记Hello, Windows Forms
    VS2005 宽字符 unicode字符集和多字节字符集
    Windows Forms 2.0 Programming 读书笔记Hello, Windows Forms(2)
  • 原文地址:https://www.cnblogs.com/ryhan/p/2132575.html
Copyright © 2011-2022 走看看