zoukankan      html  css  js  c++  java
  • 项目中使用http referer,为了盗取图片资源

    项目背景:因为图片的数据是爬取的别人的图片,而且保存的数据仅仅是图片地址链接,为了减少数据存储和服务器压力,但是这就引发一个问题,有的图片地址没有做防盗处理,可以随意的下载使用;但有些图片的服务器做了处理,其他的域名访问图片都拒绝请求,我遇到的就是使用了HTTP Referer的方式获取,从哪个网站发起的请求,如果不是本网站都拒绝,这样就没有办法获取他的图片;最后查阅资料发现有很多的办法去解决这个问题。

    先介绍 Referer :

    一、Referer 的含义

    现实生活中,购买服务或加入会员的时候,往往要求提供信息:"你从哪里知道了我们?"

    这叫做引荐人(referrer),谁引荐了你?对于公司来说,这是很有用的信息。

    互联网也是一样,你不会无缘无故访问一个网页,总是有人告诉你,可以去那里看看。服务器也想知道,你的"引荐人"是谁?

    HTTP 协议在请求(request)的头信息里面,设计了一个Referer字段,给出"引荐网页"的 URL。

    这个字段是可选的。客户端发送请求的时候,自主决定是否加上该字段。

    很有趣的是,这个字段的拼写是错的。Referer的正确拼写是Referrer,但是写入标准的时候,不知为何,没人发现少了一个字母r。标准定案以后,只能将错就错,所有头信息的该字段都一律错误拼写成Referer

    二、Referer 的发生场景

    浏览器向服务器请求资源的时候,Referer字段的逻辑是这样的,用户在地址栏输入网址,或者选中浏览器书签,就不发送Referer字段。

    主要是以下三种场景,会发送Referer字段。

    (1)用户点击网页上的链接。

    (2)用户发送表单。

    (3)网页加载静态资源,比如加载图片、脚本、样式。

    
    <!-- 加载图片 -->
    <img src="foo.jpg">
    <!-- 加载脚本 -->
    <script src="foo.js"></script>
    <!-- 加载样式 -->
    <link href="foo.css" rel="stylesheet">
    

    上面这些场景,浏览器都会将当前网址作为Referer字段,放在 HTTP 请求的头信息发送。

    浏览器的 JavaScript 引擎提供document.referrer属性,可以查看当前页面的引荐来源。注意,这里采用的是正确拼写。

    三、Referer 的作用

    Referer字段实际上告诉了服务器,用户在访问当前资源之前的位置。这往往可以用来用户跟踪。

    一个典型的应用是,有些网站不允许图片外链,只有自家的网站才能显示图片,外部网站加载图片就会报错。它的实现就是基于Referer字段,如果该字段的网址是自家网址,就放行。

    由于涉及隐私,很多时候不适合发送Referer字段。

    这里举两个例子,都不适合暴露 URL。一个是功能 URL,即有的 URL 不要登录,可以访问,就能直接完成密码重置、邮件退订等功能。另一个是内网 URL,不希望外部用户知道内网有这样的地址。Referer字段很可能把这些 URL 暴露出去。

    此外,还有一种特殊情况,需要定制Referer字段。比如社交网站上,用户在对话中提到某个网址。这时,不希望暴露用户所在的原始网址,但是可以暴露社交网站的域名,让对方知道,是我贡献了你的流量。

    四、rel属性

    由于上一节的原因,浏览器提供一系列手段,允许改变默认的Referer行为。

    对于用户来说,可以改变浏览器本身的全局设置,也可以安装浏览器扩展。这里就不详细介绍了。

    对于开发者来说,rel="noreferrer"属性是最简单的一种方法。<a><area><form>三个标签可以使用这个属性,一旦使用,该元素就不会发送Referer字段。

    
    <a href="..." rel="noreferrer" target="_blank">xxx</a>
    

    上面链接点击产生的 HTTP 请求,不会带有Referer字段。

    注意,rel="noreferrer"采用的是正确的拼写。

    五、Referrer Policy 的值

    rel属性只能定制单个元素的Referer行为,而且选择比较少,只能发送或不发送。W3C 为此制定了更强大的 Referrer Policy

    Referrer Policy 可以设定8个值。

    (1)no-referrer

    不发送Referer字段。

    (2)no-referrer-when-downgrade

    如果从 HTTPS 网址链接到 HTTP 网址,不发送Referer字段,其他情况发送(包括 HTTP 网址链接到 HTTP 网址)。这是浏览器的默认行为。

    (3)same-origin

    链接到同源网址(协议+域名+端口 都相同)时发送,否则不发送。注意,https://foo.com链接到http://foo.com也属于跨域。

    (4)origin

    Referer字段一律只发送源信息(协议+域名+端口),不管是否跨域。

    (5)strict-origin

    如果从 HTTPS 网址链接到 HTTP 网址,不发送Referer字段,其他情况只发送源信息。

    (6)origin-when-cross-origin

    同源时,发送完整的Referer字段,跨域时发送源信息。

    (7)strict-origin-when-cross-origin

    同源时,发送完整的Referer字段;跨域时,如果 HTTPS 网址链接到 HTTP 网址,不发送Referer字段,否则发送源信息。

    (8)unsafe-url

    Referer字段包含源信息、路径和查询字符串,不包含锚点、用户名和密码。

    六、Referrer Policy 的用法

    Referrer Policy 有多种使用方法

    (1)HTTP 头信息

    服务器发送网页的时候,通过 HTTP 头信息的Referrer-Policy告诉浏览器。

    
    Referrer-Policy: origin
    

    (2)<meta>标签

    也可以使用<meta>标签,在网页头部设置。

    
    <meta name="referrer" content="origin">
    

    (3)referrerpolicy属性

    <a><area><img><iframe><link>标签,可以设置referrerpolicy 属性。

    
    <a href="..." referrerpolicy="origin" target="_blank">xxx</a>
    

    七、退出页面重定向

    还有一种比较老式的技巧,但是非常有效,可以隐藏掉原始网址,谷歌和 Facebook 都在使用这种方法。

    链接的时候,不要直接跳转,而是通过一个重定向网址,就像下面这样。

    
    <a  href="/exit.php?url=http%3A%2F%2Fexample.com">Example.com</a>
    

    上面网址中,先跳转到/exit.php,然后再跳转到目标网址。这时,Referer字段就不会包含原始网址。

    以上的介绍是来自阮老师的文章HTTP Referer 教程

    回到项目

    一开始我先是在index.html文件里插入meta标签:

    <meta charset="utf-8" name="referrer" content="no-referrer">

    能行,但是这会引发另外的一个问题,就是我项目中使用的百度统计(后期改用了友盟统计),这样会干扰我的数据统计,不可行;

    于是乎,既然是img标签,我就直接在img标签上添加referrerpolicy属性;

    <img class="detailImg" referrerpolicy="no-referrer" :src="url"/>

    这样他就只在请求图片的时候才会禁止携带源信息;

  • 相关阅读:
    asp.net Forms验证跨域页面不能访问的问题
    JavaScript创建命名空间
    DataTable转换成JSON字符串的函数
    javascript 正确截取单字节和双字节混和字符串的方法
    异常详细信息: 不能通过已删除的行访问该行的信息
    HttpUtility.ParseQueryString直接从字符串URL中提取参数
    支持函数,变量的算术表达式计算(三、加入函数)
    mp3 分类管理工具
    我好累
    电饭煲是如何知道饭已熟了的
  • 原文地址:https://www.cnblogs.com/wangtaolearning/p/11294823.html
Copyright © 2011-2022 走看看