一、 通信数据转发程序:代理、网关、隧道
- 一台 Web 服务器可搭建多个独立域名的 Web 网站,也可作为通信路径上的中转服务器提升传输效率
代理:
代理是一种有转发功能的应用程序,它扮演了位于服务器和客户端“中间人”的角色,接收由客户端发送的请求并转发给服务器,同时也接收服务器返回的响应并转发给客户端。网关:
网关是转发其他服务器通信数据的服务器,接收从客户端发送来的请求时,它就像自己拥有资源的源服务器一样对请求进行处理。有时客户端可能都不会察觉,自己的通信目标是一个网关隧道:
隧道是在相隔甚远的客户端和服务器两者之间进行中转,并保持双方通信连接的应用程序
二、HTTP首部
- 使用首部字段是为了给浏览器和服务器提供报文主体大小、所使用的语言、认证信息等内容
2.1 HTTP 首部字段结构
HTTP 首部字段是由首部字段名和字段值构成的,中间用冒号“:” 分隔
首部字段名: 字段值
例如,在 HTTP 首部中以 Content-Type 这个字段来表示报文主体的对象类型。
Content-Type: text/html
若 HTTP 首部字段重复了会如何?
根据浏览器内部处理逻辑的不同,结果可能并不一致,浏览器处理有差异
2.2 4种HTTP首部字段类型
HTTP 首部字段根据实际用途被分为以下 4 种类型。
1. 通用首部字段(General Header Fields)
请求报文和响应报文两方都会使用的首部
2. 请求首部字段(Request Header Fields)
从客户端向服务器端发送请求报文时使用的首部。补充了请求的附加内容、客户端信息、响应内容相关优先级等信息
3. 响应首部字段(Response Header Fields)
从服务器端向客户端返回响应报文时使用的首部。补充了响应的附加内容,也会要求客户端附加额外的内容信息。
4. 实体首部字段(Entity Header Fields)
针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新时间等与实体有关的信息。
2.3 HTTP/1.1 首部字段一览
HTTP/1.1 规范定义了如下 47 种首部字段
- 通用首部字段 9个
首部字段名 | 说明 |
---|---|
Cache-Control | 控制缓存的行为 |
Connection | 逐跳首部、连接的管理 |
Date | 创建报文的日期时间 |
Pragma | 报文指令 |
Trailer | 报文末端的首部一览 |
Transfer-Encoding | 指定报文主体的传输编码方式 |
Upgrade | 升级为其他协议 |
Via | 代理服务器的相关信息 |
Warning | 错误通知 |
- 请求首部字段 共18个
首部字段名 | 说明 |
---|---|
Accept | 用户代理可处理的媒体类型 |
Accept-Charset | 优先的字符集 |
Accept-Encoding | 优先的内容编码 |
Accept-Language | 优先的语言(自然语言) |
AuthorizationWeb | 认证信息 |
Expect | 期待服务器的特定行为 |
From | 用户的电子邮箱地址 |
Host | 请求资源所在服务器 |
If-Match | 比较实体标记(ETag) |
If-Modified-Since | 比较资源的更新时间 |
If-None-Match | 比较实体标记(与 If-Match 相反) |
If-Range | 资源未更新时发送实体 Byte 的范围请求 |
If-Unmodified-Since | 比较资源的更新时间(与If-Modified-Since相反) |
Max-Forwards | 最大传输逐跳数 |
Proxy-Authorization | 代理服务器要求客户端的认证信息 |
Range | 实体的字节范围请求 |
Referer | 对请求中 URI 的原始获取方 |
TE | 传输编码的优先级 |
User-AgentHTTP | 客户端程序的信息 |
- 响应首部字段 共9个
首部字段名 | 说明 |
---|---|
Accept-Ranges | 是否接受字节范围请求 |
Age | 推算资源创建经过时间 |
ETag | 资源的匹配信息 |
Location | 令客户端重定向至指定URI |
Proxy-Authenticate | 代理服务器对客户端的认证信息 |
Retry-After | 对再次发起请求的时机要求 |
Server | HTTP服务器的安装信息 |
Vary | 代理服务器缓存的管理信息 |
WWW-Authenticate | 服务器对客户端的认证信息 |
- 实体首部字段 共10个
首部字段名 | 说明 |
---|---|
Allow | 资源可支持的HTTP方法 |
Content-Encoding | 实体主体适用的编码方式 |
Content-Language | 实体主体的自然语言 |
Content-Length | 实体主体的大小(单位:字节) |
Content-Location | 替代对应资源的URI |
Content-MD5 | 实体主体的报文摘要 |
Content-Range | 实体主体的位置范围 |
Content-Type | 实体主体的媒体类型 |
Expires | 实体主体过期的日期时间 |
Last-Modified | 资源的最后修改日期时间 |
在 HTTP 协议通信交互中使用到的首部字段,不限于 RFC2616 中定义的 47 种首部字段。还有 Cookie、Set-Cookie 和 Content-Disposition等在其他 RFC 中定义的首部字段,它们的使用频率也很高。
这些非正式的首部字段统一归纳在 RFC4229 HTTP Header FieldRegistrations 中。
- End-to-end 首部和 Hop-by-hop 首部
HTTP 首部字段将定义成缓存代理和非缓存代理的行为,分成 2 种类型
端到端首部(End-to-end Header)
分在此类别中的首部会转发给请求 / 响应对应的最终接收目标,且必须保存在由缓存生成的响应中,
另外规定它必须被转发。
逐跳首部(Hop-by-hop Header)
分在此类别中的首部只对单次转发有效,会因通过缓存或代理而不再转发。
HTTP/1.1 和之后版本中,如果要使用 hop-by-hop 首部,需提供 Connection 首部字段。
在HTTP/1.1 中的逐跳首部字段。除这 8 个首部字段之外,其他所有字段都属于端到端首部。
1.Connection
2.Keep-Alive
3.Proxy-Authenticate
4.Proxy-Authorization
5.Trailer
6.TE
7.Transfer-Encoding
8.Upgrade
2.4 HTTP/1.1 通用首部字段 说明
首部字段 Cache-Control 能够控制缓存的行为
如:Cache-Control: private, max-age=0, no-cache
1. Cache-Control 可用值指令一览及解释
- 缓存请求指令
指令 | 参数 | 说明 |
---|---|---|
no-cache | 无 | 强制向源服务器再次验证 |
no-store | 无 | 不缓存请求或响应的任何内容 |
max-age = [ 秒] | 必需 | 响应的最大Age值 |
max-stale( = [ 秒]) 可省略 | 接收已过期的响应 | |
min-fresh = [ 秒] | 必需 | 期望在指定时间内的响应仍有效 |
no-transform | 无 | 代理不可更改媒体类型 |
only-if-cached | 无 | 从缓存获取资源 |
cache-extension | - | 新指令标记(token) |
- 缓存响应指令
指令 | 参数 | 说明 |
---|---|---|
public | 无 | 可向任意方提供响应的缓存 |
private | 可省略 | 仅向特定用户返回响应 |
no-cache | 可省略 | 缓存前必须先确认其有效性 |
no-store | 无 | 不缓存请求或响应的任何内容 |
no-transform | 无 | 代理不可更改媒体类型 |
must-revalidate | 无 | 可缓存但必须再向源服务器进行确认 |
proxy-revalidate | 无 | 要求中间缓存服务器对缓存的响应有效性再进行确认 |
max-age = [ 秒] | 必需 | 响应的最大Age值 |
s-maxage = [ 秒] | 必需 | 公共缓存服务器响应的最大Age值 |
cache-extension | - | 新指令标记(token) |
public:表示是否能缓存的指令
private:
当指定 private 指令后,响应只以特定的用户作为对象,这与 public指令的行为相反。
缓存服务器会对该特定用户提供资源缓存的服务,对于其他用户发送过来的请求,代理服务器则不会返回缓存
no-cache:
使用 no-cache 指令的目的是为了防止从缓存中返回过期的资源
no-store:
当使用 no-store 指令时,暗示请求(和对应的响应)或响应中包含机密信息
no-store 才是真正地不进行缓存,请读者注意区别理解
因此,该指令规定缓存不能在本地存储请求或响应的任一部分
指定缓存期限和认证的指令
s-maxage: Cache-Control: s-maxage=604800(单位:秒)
当使用 s-maxage 指令后,则直接忽略对 Expires 首部字段及max-age 指令的处理。
max-age: Cache-Control: max-age=604800(单位:秒)
数值代表资源保存为缓存的最长时间
当客户端发送的请求中包含 max-age 指令时,如果判定缓存资源的缓存时间数值比指定时间的数值更小,
那么客户端就接收缓存的资源。
另外,当指定 max-age 值为 0,那么缓存服务器通常需要将请求转发给源服务器
当服务器返回的响应中包含 max-age 指令时,缓存服务器将不对资源的有效性再作确认,而 max-age 数值代表资源保存为缓存的最长时间。
HTTP/1.1 版本的缓存服务器遇到同时存在 Expires 首部字段的情况时,
会优先处理 max-age 指令,而忽略掉 Expires 首部字段
min-fresh: Cache-Control: min-fresh=60(单位:秒)
指令要求缓存服务器返回至少还未过指定时间的缓存资源。
max-stale: Cache-Control: max-stale=3600(单位:秒)
如果指令未指定参数值,那么无论经过多久,客户端都会接收响应;
如果指令中指定了具体数值,那么即使过期,只要仍处于 max-stale指定的时间内,仍旧会被客户端接收。
2. Connection 首部字段具备如下两个作用
控制不再转发给代理的首部字段
管理持久连接
Connection: close
HTTP/1.1 版本的默认连接都是持久连接。为此,客户端会在持久连接上连续发送请求。
当服务器端想明确断开连接时,则指定Connection 首部字段的值为 Close
3. Date 表明创建 HTTP 报文的日期和时间
HTTP/1.1 协议使用在 RFC1123 中规定的日期时间的格式,如下示例
Date: Tue, 03 Jul 2012 04:40:59 GMT
4. Pragma
Pragma 是 HTTP/1.1 之前版本的历史遗留字段,仅作为与 HTTP/1.0的向后兼容而定义。
5. Trailer
首部字段 Trailer 会事先说明在报文主体后记录了哪些首部字段。
该首部字段可应用在 HTTP/1.1 版本分块传输编码时。
6. Transfer-Encoding95
首部字段 Transfer-Encoding 规定了传输报文主体时采用的编码方式。
HTTP/1.1 的传输编码方式仅对分块传输编码有效
7. Upgrade
首部字段 Upgrade 用于检测 HTTP 协议及其他协议是否可使用更高的版本进行通信,
其参数值可以用来指定一个完全不同的通信协议。
8. Via
是为了追踪客户端与服务器之间的请求和响应报文的传输路径
9. Warning
HTTP/1.1 的 Warning 首部是从 HTTP/1.0 的响应首部(Retry-After)演变过来的。
该首部通常会告知用户一些与缓存相关的问题的警告
2.5 HTTP/1.1 请求首部字段 说明
请求首部字段是从客户端往服务器端发送请求报文中所使用的字段,
用于补充请求的附加信息、客户端信息、对响应内容相关的优先级等内容。
1. Accept
Accept 首部字段可通知服务器,用户代理能够处理的媒体类型及媒体类型的相对优先级。
可使用 type/subtype 这种形式,一次指定多种媒体类型
Accept: text/html,application/xhtml+xml,application/xml;q=0.
几个媒体类型的例子
文本文件
text/html, text/plain, text/cs ...
application/xhtml+xml, application/xml ...
图片文件
image/jpeg, image/gif, image/png ...
视频文件
video/mpeg, video/quicktime ...
应用程序使用的二进制文件
application/octet-stream, application/zip ...
若想要给显示的媒体类型增加优先级,则使用 q= 来额外表示权重值1,用分号(;)进行分隔。
权重值 q 的范围是 0~1(可精确到小数点后 3 位),且 1 为最大值。不指定权重 q 值时,默认权重为 q=1.0。
2. Accept-Charset
Accept-Charset 首部字段可用来通知服务器用户代理支持的字符集及字符集的相对优先顺序。
另外,可一次性指定多种字符集。与首部字段 Accept 相同的是可用权重 q 值来表示相对优先级。
3. Accept-Encoding
Accept-Encoding: gzip, deflate
Accept-Encoding 首部字段用来告知服务器用户代理支持的内容编码及内容编码的优先级顺序。
可一次性指定多种内容编码
几个内容编码的例子:
gzip:
由文件压缩程序 gzip(GNU zip)生成的编码格式(RFC1952),
采用 Lempel-Ziv 算法(LZ77)及 32 位循环冗余校验(Cyclic Redundancy Check,通称 CRC)
compress:
由 UNIX 文件压缩程序 compress 生成的编码格式,采用 Lempel-Ziv-Welch 算法(LZW)
deflate:
组合使用 zlib 格式(RFC1950)及由 deflate 压缩算法(RFC1951)生成的编码格式
identity:
不执行压缩或不会变化的默认编码格式
也可使用星号(*)作为通配符,指定任意的编码格式
4. Accept-Language
Accept-Language: zh-cn,zh;q=0.7,en-us,en;q=0.3
用来告知服务器用户代理能够处理的自然语言集(指中文或英文等),以及自然语言集的相对优先级。
可一次指定多种自然语言集
5. Authorization
是用来告知服务器,用户代理的认证信息(证书值)
6. Expect
Expect: 100-continue
客户端使用首部字段 Expect 来告知服务器,期望出现的某种特定行为。
7.From
首部字段 From 用来告知服务器使用用户代理的用户的电子邮件地址通常
将电子邮件地址记录在 User-Agent 首部字段
8.Host
首部字段 Host 会告知服务器,请求的资源所处的互联网主机名和端口号。
Host 首部字段在 HTTP/1.1 规范内是唯一一个必须被包含在请求内的首部字段
首部字段 Host 和以单台服务器分配多个域名的虚拟主机的工作机制有很密切的关联,
这是首部字段 Host 必须存在的意义
请求被发送至服务器时,请求中的主机名会用 IP 地址直接替换解决。但如果这时,
相同的 IP 地址下部署运行着多个域名,那么服务器就会无法理解究竟是哪个域名对应的请求。
因此,就需要使用首部字段 Host 来明确指出请求的主机名。
若服务器未设定主机名,那直接发送一个空值即可
如下:
Host:
9. If-Match
形如 If-xxx 这种样式的请求首部字段,都可称为条件请求。
服务器接收到附带条件的请求后,只有判断指定条件为真时,才会执行请求
只有当 If-Match 的字段值跟 ETag 值匹配一致时,服务器才会接受请求
10. If-Modified-Since
如果在 If-Modified-Since 字段指定的日期时间后,资源发生了更新,服务器会接受请求
11. If-None-Match
只有在 If-None-Match 的字段值与 ETag 值不一致时,可处理该请求
12.If-Range
首部字段 If-Range 属于附带条件之一。
它告知服务器若指定的 If-Range 字段值(ETag 值或者时间)和请求资源的 ETag 值或时间相一致时,则作为范围请求处理。反之,则返回全体资源
13. If-Unmodified-Since
首部字段 If-Unmodified-Since 和首部字段 If-Modified-Since 的作用相反。
它的作用的是告知服务器,指定的请求资源只有在字段值内指定的日期时间之后,未发生更新的情况下,才能处理请求。
如果在指定日期时间后发生了更新,则以状态码 412 Precondition Failed 作为响应返回
14. Max-Forwards
请求可能会经过代理等多台服务器。途中,如果代理服务器由于某些原因导致请求转发失败,客户端也就等不到服务器返回的响应了。对此,我们无从可知。
可以灵活使用首部字段 Max-Forwards,针对以上问题产生的原因展开调查。
15. Proxy-Authorization
接收到从代理服务器发来的认证质询时,客户端会发送包含首部字段Proxy-Authorization 的请求,以告知服务器认证所需要的信息
16. Range
对于只需获取部分资源的范围请求,包含首部字段 Range 即可告知服务器资源的指定范围。
17. Referer
首部字段 Referer 会告知服务器请求的原始资源的 URI。
客户端一般都会发送 Referer 首部字段给服务器。
但当直接在浏览器的地址栏输入 URI,或出于安全性的考虑时,也可以不发送该首部字段。
因为原始资源的 URI 中的查询字符串可能含有 ID 和密码等保密信息,要是写进 Referer 转发给其他服务器,则有可能导致保密信息的泄露
Referer 的正确的拼写应该是 Referrer,但不知为何,大家一直沿用这个错误的拼写
18. TE
首部字段 TE 会告知服务器客户端能够处理响应的传输编码方式及相对优先级。
它和首部字段 Accept-Encoding 的功能很相像,但是用于传输编码。
19. User-Agent
首部字段 User-Agent 会将创建请求的浏览器和用户代理名称等信息传达给服务器
由网络爬虫发起请求时,有可能会在字段内添加爬虫作者的电子邮件地址。
此外,如果请求经过代理,那么中间也很可能被添加上代理服务器的名称
2.6 HTTP/1.1 响应首部字段 说明
响应首部字段是由服务器端向客户端返回响应报文中所使用的字段,用于补充响应的附加信息、服务器信息,以及对客户端的附加要求等信息。
1. Accept-Ranges
首部字段 Accept-Ranges 是用来告知客户端服务器是否能处理范围请求,以指定获取服务器端某个部分的资源。
可指定的字段值有两种,可处理范围请求时指定其为 bytes,反之则指定其为 none
2.Age
首部字段 Age 能告知客户端,源服务器在多久前创建了响应。字段值的单位为秒
3.ETag
首部字段 ETag 能告知客户端实体标识。它是一种可将资源以字符串形式做唯一性标识的方式。
服务器会为每份资源分配对应的 ETag值
资源被缓存时,就会被分配唯一性标识。例如,当使用中文版的浏览器访问http://www.google.com/时,就会返回中文版对应的资源,而使用英文版的浏览器访问时,则会返回英文版对应的资源。
两者的URI 是相同的,所以仅凭 URI 指定缓存的资源是相当困难的。
若在下载过程中出现连接中断、再连接的情况,都会依照 ETag 值来指定资源
ETag 中有强 ETag 值和弱 ETag 值之分
4. Location
使用首部字段 Location 可以将响应接收方引导至某个与请求 URI 位置不同的资源。
该字段会配合 3xx :Redirection 的响应,提供重定向的URI
几乎所有的浏览器在接收到包含首部字段 Location 的响应后,都会强制性地尝试对已提示的重定向资源的访问
5. Proxy-Authenticate
首部字段 Proxy-Authenticate 会把由代理服务器所要求的认证信息发送给客户端。
6. Retry-After
首部字段 Retry-After 告知客户端应该在多久之后再次发送请求。
字段值可以指定为具体的日期时间(Wed, 04 Jul 2012 06:34:24GMT 等格式)。
也可以是创建响应后的秒数。
7. Server
首部字段 Server 告知客户端当前服务器上安装的 HTTP 服务器应用程序的信息。
不单单会标出服务器上的软件应用名称,还有可能包括版本号和安装时启用的可选项。
8. Vary
Vary: Accept-Language
当代理服务器接收到带有 Vary 首部字段指定获取资源的请求时,如果使用的 Accept-Language 字段的值相同,那么就直接从缓存返回响应。反之,则需要先从源服务器端获取资源后才能响应
9. WWW-Authenticate
首部字段 WWW-Authenticate 用于 HTTP 访问认证
它会告知客户端适用于访问请求 URI 所指定资源的认证方案(Basic 或是 Digest)和带参数提示的质询(challenge)。
状态码 401 Unauthorized 响应中,肯定带有首部字段 WWW-Authenticate。
2.7 HTTP/1.1 实体首部字段 说明
实体首部字段是包含在请求报文和响应报文中的实体部分所使用的首部,用于补充内容的更新时间等与实体相关的信息。
在请求和响应两方的 HTTP 报文中都含有与实体相关的首部字段
1. Allow
Allow: GET, HEAD
Allow 用于通知客户端能够支持 Request-URI 指定资源的所有 HTTP 方法。
当服务器接收到不支持的 HTTP 方法时,会以状态码405 Method Not Allowed 作为响应返回。
与此同时,还会把所有能支持的 HTTP 方法写入首部字段 Allow 后返回。
2. Content-Encoding
Content-Encoding 会告知客户端服务器对实体的主体部分选用的内容编码方式。
内容编码是指在不丢失实体信息的前提下所进行的压缩
有一下4种编码方式:
gzip
compress
deflate
identity
3. Content-Language
Content-Language: zh-CN
Content-Language 会告知客户端,实体主体使用的自然语言(指中文或英文等语言)
4. Content-Length
Content-Length 表明了实体主体部分的大小(单位是字节)
对实体主体进行内容编码传输时,不能再使用 Content-Length首部字段
5. Content-Location
首部字段 Content-Location 给出与报文主体部分相对应的 URI。
和首部字段 Location 不同,Content-Location 表示的是报文主体返回资源对应的 URI。
6. Content-MD5
客户端会对接收的报文主体执行相同的 MD5 算法,然后与首部字段 Content-MD5 的字段值比较
采用这种方法,对内容上的偶发性改变是无从查证的,也无法检测出恶意篡改。
其中一个原因在于,内容如果能够被篡改,那么同时意味着 Content-MD5 也可重新计算然后被篡改。
所以处在接收阶段的客户端是无法意识到报文主体以及首部字段 Content-MD5 是已经被篡改过的。
7. Content-Range
Content-Range: bytes 5001-10000/1000
针对范围请求,返回响应时使用的首部字段 Content-Range,能告知客户端作为响应返回的实体的哪个部分符合范围请求。
字段值以字节为单位,表示当前发送部分及整个实体大小
8. Content-Type
Content-Type: text/html; charset=UTF-8
Content-Type 说明了实体主体内对象的媒体类型。和首部字段 Accept 一样,
字段值用 type/subtype 形式赋值。
9. Expires
Expires 会将资源失效的日期告知客户端。缓存服务器在接收到含有首部字段 Expires 的响应后,
会以缓存来应答请求,在Expires 字段值指定的时间之前,响应的副本会一直被保存。
当超过指定的时间后,缓存服务器在请求发送过来时,会转向源服务器请求资源。
源服务器不希望缓存服务器对资源缓存时,最好在 Expires 字段内写入与首部字段 Date 相同的时间值
当首部字段 Cache-Control 有指定 max-age 指令时,比起首部字段 Expires,会优先处理 max-age 指令。
当首部字段 Cache-Control 有指定 max-age 指令时,比起首部字段 Expires,会优先处理 max-age 指令
10. Last-Modified
Last-Modified: Wed, 23 May 2012 09:59:55 GMT
首部字段 Last-Modified 指明资源最终修改的时间
一般来说,这个值就是 Request-URI 指定资源被修改的时间。
但类似使用 CGI 脚本进行动态数据处理时,该值有可能会变成数据最终修改时的时间。
2.8 为 Cookie 服务的首部字段
管理服务器与客户端之间状态的 Cookie,虽然没有被编入标准化HTTP/1.1 的 RFC2616 中,但在 Web 网站方面得到了广泛的应用
Cookie 的工作机制是用户识别及状态管理。Web 网站为了管理用户的状态会通过 Web 浏览器,把一些数据临时写入用户的计算机内。接着当用户访问该Web网站时,可通过通信方式取回之前发放的Cookie。
调用 Cookie 时,由于可校验 Cookie 的有效期,以及发送方的域、路径、协议等信息,所以正规发布的 Cookie 内的数据不会因来自其他Web 站点和攻击者的攻击而泄露。
1. Set-Cookie
当服务器准备开始管理客户端的状态时,会事先告知各种信息。
以下是 Set-Cookie 字段的属性
属性 | 说明 |
---|---|
NAME=VALUE | 赋予 Cookie 的名称和其值(必需项) |
expires=DATE | Cookie 的有效期(若不明确指定则默认为浏览器关闭前为止) |
path=PATH | 将服务器上的文件目录作为Cookie的适用对象(若不指定则默认为文档所在的文件目录) |
domain=域名 | 作为 Cookie 适用对象的域名(若不指定则默认为创建 Cookie的服务器的域名) |
Secure | 仅在 HTTPS 安全通信时才会发送 Cookie |
HttpOnly | 加以限制,使 Cookie 不能被 JavaScript 脚本访问 |
1. expires 属性:
Cookie 的 expires 属性指定浏览器可发送 Cookie 的有效期。
当省略 expires 属性时,其有效期仅限于维持浏览器会话(Session)时间段内。
这通常限于浏览器应用程序被关闭之前
一旦 Cookie 从服务器端发送至客户端,服务器端就不存在可以显式删除 Cookie 的方法。
但可通过覆盖已过期的 Cookie,实现对客户端 Cookie 的实质性删除操作
2. path 属性:
Cookie 的 path 属性可用于限制指定 Cookie 的发送范围的文件目录。
不过另有办法可避开这项限制,看来对其作为安全机制的效果不能抱有期待
3. domain 属性:
通过 Cookie 的 domain 属性指定的域名可做到与结尾匹配一致。
比如,当指定 example.com 后,除 example.com 以外,www.example.com或 www2.example.com 等都可以发送 Cookie。
因此,除了针对具体指定的多个域名发送 Cookie 之外,不指定domain 属性显得更安全。
4. secure 属性:
Cookie 的 secure 属性用于限制 Web 页面仅在 HTTPS 安全连接时,才可以发送 Cookie。
Set-Cookie: name=value; secure
紧当 HTTPS 安全连接的情况下才会进行 Cookie 的回收。也就是说,即使域名相同,也不会发生 Cookie 回收行为
5. HttpOnly 属性:
Cookie 的 HttpOnly 属性是 Cookie 的扩展功能,它使 JavaScript 脚本无法获得 Cookie。
其主要目的为防止跨站脚本攻击(Cross-sitescripting,XSS)对 Cookie 的信息窃取。
通常从 Web 页面内还可以对 Cookie 进行读取操作。
但使用 JavaScript 的 document.cookie 就无法读取附加 HttpOnly 属性后的 Cookie 的内容了
Cookie
Cookie: status=enable
首部字段 Cookie 会告知服务器,当客户端想获得 HTTP 状态管理支持时,就会在请求中包含从服务器接收到的 Cookie。
接收到多个Cookie 时,同样可以以多个 Cookie 形式发送
2.8 其他部首字段
HTTP 首部字段是可以自行扩展的。所以在 Web 服务器和浏览器的应用上,会出现各种非标准的首部字段
以下为常见的几种:
X-Frame-Options
X-XSS-Protection
DNT
P3P
1. X-Frame-Options
首部字段 X-Frame-Options 属于 HTTP 响应首部,用于控制网站内容在其他 Web 网站的 Frame 标签内的显示问题。
其主要目的是为了防止点击劫持(clickjacking)攻击
两个可指定的字段值:
DENY:拒绝
SAMEORIGIN:仅同源域名下的页面(Top-level-browsing-context)匹配时许可
2. X-XSS-Protection
首部字段 X-XSS-Protection 属于 HTTP 响应首部,它是针对跨站脚本攻击(XSS)的一种对策,
用于控制浏览器 XSS 防护机制的开关。
0 :将 XSS 过滤设置成无效状态
1 :将 XSS 过滤设置成有效状态
3. DNT
首部字段 DNT 属于 HTTP 请求首部,其中 DNT 是 Do Not Track 的简称,意为拒绝个人信息被收集,
是表示拒绝被精准广告追踪的一种方法。
首部字段 DNT 可指定的字段值如下:
0 :同意被追踪
1 :拒绝被追踪
由于首部字段 DNT 的功能具备有效性,所以 Web 服务器需要对 DNT做对应的支持。
4. P3P
首部字段 P3P 属于 HTTP 相应首部,通过利用 P3P(The Platform forPrivacy Preferences,
在线隐私偏好平台)技术,可以让 Web 网站上的个人隐私变成一种仅供程序可理解的形式,以达到保护用户隐私的目的。