zoukankan      html  css  js  c++  java
  • 让百度删除不想收录的域名或快照的最快方法

    简单介绍:个别站点可能会出现下面类似困扰:①、百度收录了自己不想收录的域名,造成内容反复。比方张戈博客,百度近一半的收录是www的域名。并且收录的内容还是反复的。实际上张戈博客的首选域名是不带www,就算一開始就做了 ...

    个别站点可能会出现下面类似困扰:

    ①、百度收录了自己不想收录的域名。造成内容反复。比方张戈博客,百度近一半的收录是www的域名,并且收录的内容还是反复的!

    实际上张戈博客的首选域名是不带www,就算一開始就做了301,也被百度无视了;

    ②、站点中途才设置的伪静态。收录正常后发现依旧存在旧的动态链接。想删除之;

    ③、百度收录了虚拟主机自带的三级域名,想删除之。

    ④、站点改版,如精简分类数量、改动分类名称,造成了url死链,想删除之;

          先详细说一下张戈博客是怎样解决第①个困扰的:

    前些天分享的《彻底禁止搜索引擎收录非首选域名的方法》,实际上仅适合新站设置,而我这样的中途做禁止设置的站点,仅仅会收到来自百度的robots禁封提醒。而不会删除之前的收录:

    那我该怎样彻底删除这些反复收录呢?

    方法非常easy。利用百度站长平台的闭站保护功能就可以。经多次尝试,张戈博客www域名反复收录最终所有清空了。

    以下说下详细方法:

           一、去掉robots限制

    假设之前对该域名做过robots禁封的话,须要先解除限制,删除robots就可以。由于。你都不让百度抓取了,百度当然不知道你这些链接还能不能用,该不该删?他仅仅会觉得你是粗心误操作了robots而已。

          二、设置404状态

    经測试,百度的闭站功能申请通过的前提条件是,全部链接必须是404死链状态,否则无法通过:

    所以,我们先对那些已收录的非首选域名。设置404返回码。即死链状态。假设之前设置了301,记得要取消掉

           

    ①、Nginx

    例如以下改动之前非首选域名的监听设置:

    server
             {
                    server_name www.zhangge.net;
                    root  /home/wwwroot/zhangge.net;
                    location / {
                            #所有返回404
                            return 404;
                            }
    }

     ②、PHP通用

    将下面代码加入到站点的head部分

    <?

    php if($_SERVER['HTTP_HOST'] == 'www.zhangge.net') { ?> header('HTTP/1.1 404 Not Found'); header("status: 404 Not Found"); <?php } ?>

     ③、ASP通用

    相同的将下面代码加入到站点head部分(注意是动态模板。而不是静态页)

    <%  
       Response.Status = "404 Not Found"  
    %>

    设置完毕后,记得手动訪问測试下效果。

           三、闭站申请

    404确认无误之后,打开百度站长平台的抓取频率,选择闭站保护

    http://zhanzhang.baidu.com/pressure/close

    然后,选择你要关闭的非首选域名,比方www.zhangge.net。最后在下方继续勾选www.zhangge.net。提交就可以!

    切记不要提交带星号(*)的选项,那是指全部相关域名!

    大概2天左右,就收到了闭站申请通过的通知:

    能够看到,张戈前后測试了3次,前2次測试提交时,採用的是403或者是仅针对搜索引擎的404设置。结果都没通过。看来,闭站保护是採用人工审核的,而非机器。

    Ps:闭站是对整个域名删除的最快方法。但假设是删除部分收录。那就得使用百度站长平台的死链提交功能。

          四、补刀设置

    如今再去site非首选域名,发现已所有删除干净:

    我的目的已经达到!

    为了保持用户体验,如今须要恢复之前的301跳转和robots禁封设置:

    參考之前写的的《彻底禁止搜索引擎收录非首选域名的方法》。又一次设置了robots禁止收录和301跳转。如今,仅仅要我不去申请闭站恢复。我相信百度再也不会收录www域名了!

          五、写在最后

    看完针对困扰①的解决的方法。相信其它困扰也能够依葫芦画瓢的做好对应处理。

    原理非常easy,你想要删除哪个快照或域名,仅仅须要将这些对象设置为404死链状态,然后去百度站长平台做死链提交就可以。一般2~3天就能立竿见影。至于。怎样设置404死链状态,则须要对症下药,方法不尽同样,张戈就不赘述了。

    当然,你有不论什么须要都能够去留言板留言告知。

          原文地址:http://zhangge.net/4506.html
  • 相关阅读:
    linux办公软件的使用和病毒防范
    需要了解的基本礼仪素养
    遗留问题
    shell基本命令
    shell编程
    遇到过得问题
    mac电脑操作
    Linux编程
    BZOJ 1601 [Usaco2008 Oct]灌水 (建图+mst)
    BZOJ 2653 middle (可持久化线段树+中位数+线段树维护最大子序和)
  • 原文地址:https://www.cnblogs.com/yangykaifa/p/7142303.html
Copyright © 2011-2022 走看看