zoukankan      html  css  js  c++  java
  • 如何让网站被快速收录?

    如何让网站(独立网站或者blog)被百度收录?

    百度会收录符合用户搜索体验的网站和网页。
    为促使百度Spider更快的发现您的站点,您也可以向我们提交一下您的网站的入口网址。提交地址是:http://www.baidu.com/search/url_submit.html。您只需提交首页即可,无需提交详细的内容页面。
    百度的网页收录机制,只和网页价值有关,与百度推广等商业因素没有任何关联。


    如何查看网站是否被百度收录?site语法看到的结果数是不是收录的真实数量?

    百度是否已经收录您的网站可以通过执行site语法查看,直接在百度搜索中输入site:您的域名,如site:www.baidu.com,如果可以查询到结果,那您的网站就已经被百度收录。
    site语法得到的搜索结果数,只是一个估算的数值,仅供参考。
    如需查询相对准确的收录量,请使用百度统计的收录量查询功能。

    如何让网页不被百度收录?

    百度严格遵循搜索引擎Robots协议(详细内容,参见http://www.robotstxt.org/)。
    您可以设置一个Robots文件以限制您的网站全部网页或者部分目录下网页不被百度收录。具体写法,参见:如何撰写Robots文件。
    如果您的网站在被百度收录之后才设置Robots文件禁止抓取,那么新的Robots文件通常会在48小时内生效,生效以后的新网页,将不再建入索引。需要注意的是,robots.txt禁止收录以前百度已收录的内容,从搜索结果中去除可能需要数月的时间。
    如果您的拒绝被收录需求非常急迫,可以在投诉中心反馈,我们会尽快处理。


    为什么网站内一些不设链接的私密性网页,甚至是需要访问权限的网页,也会被百度收录?

    Baiduspider对网页的抓取,是通过网页与网页之间的链接实现的。
    网页之间的链接类型,除了站点内部的页面链接之外,还有不同网站之间的互相链接。因此,某些网页即便通过您的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。
    百度Spider的访问权限,和普通用户是一样的。因此,普通用户没有权限访问的内容,Spider也没有权限访问。之所以看上去某些访问权限限制内容被百度收录,原因有两点:
    A. 该内容在Spider访问时是没有权限限制的,但抓取之后,内容的权限发生了变化
    B. 该内容有权限限制,但是由于网站安全漏洞问题,导致用户可以通过某些特殊路径直接访问。而一旦这样的路径被公布在互联网上,则Spider就会循着这条路径抓出受限内容
    如果您不希望这些私密性内容被百度收录,一方面可以通过Robots协议加以限制;另一方面,也可以通过投诉中心反馈给我们进行解决。


    为什么网站收录数量越来越少?

    您的网站所在的服务器不稳定,Baiduspider在检查更新时抓取不到网页而被暂时去除。
    您的网站不符合用户的搜索体验。


    网页为什么会从百度搜索结果中消失?

    百度并不允诺所有网页都可从百度搜索到。
    如果您的网页长时间无法从百度搜索到,或者突然从百度的搜索结果中消失,可能的原因有:
    A. 您的网页不符合用户的搜索体验
    B. 您的网站所在服务器不稳定,被百度暂时性去除,稳定之后,问题会得到解决
    C. 您的网页内容有不符合国家法律和法规规定的地方
    D. 其他技术性问题
    以下的说法是错误的和毫无根据的:
    A. 参与了百度推广但未续费,会从百度搜索结果中消失
    B. 参与了其他搜索引擎的广告项目,会从百度搜索结果中消失
    C. 与百度旗下网站产生了竞争,会从百度搜索结果中消失
    D. 从百度获得的流量太大,会从百度搜索结果中消失


    什么样的网页会被百度认为是没有价值而不被百度收录或者从现有搜索结果中消失?

    百度只收录对用户有价值的网页。任何网页在搜索结果中的去留变化,都是机器算法计算和调整的结果。下述类型的网页,百度明确不会欢迎:
    A.网页做了很多针对搜索引擎而非用户的处理,使得用户从搜索结果中看到的内容与页面实际内容完全不同,或者使得网页在搜索结果中获得了不恰当的排名,从而导致用户产生受欺骗感觉。
    如果您的网站中有较多这种页面,那么这可能会使您的整个网站的页面收录和排序受到影响。
    B. 网页是复制自互联网上的高度重复性的内容。
    C. 网页中有不符合中国法律和法规的内容。


    如果网站因为作弊行为而从百度搜索结果中消失,是否还有被重新收录可能?

    凡是作出完全修正的网站,都有机会被百度重新收录。百度会定期对被处理站点进行自动评估,并对符合条件者重新收录。
    需要说明的是,百度技术和产品部门只对用户搜索体验负责。以下的说法都是错误的和毫无根据的:
    A. 我成为百度的广告客户或者联盟网站,就可以重新被收录
    B. 我给百度若干钞票,就可以重新被收录
    C. 我认识百度的某某人,就可以重新被收录


    网站更新了,可是百度收录的内容还没更新怎么办?

    百度会定期自动更新所有网页(包括去除死链接,更新域名变化,更新内容变化)。因此请耐心等一段时间,您的网站上的变化就会被百度察觉并修正。

    为什么网站在百度收录的数量和其他搜索引擎相比相差很多?

    通常情况下,这是正常的现象,不同的搜索引擎判断网页价值的算法不同。

  • 相关阅读:
    Java中的线程Thread方法之---interrupt() 分类: Android Java 2014-02-26 08:51 3189人阅读 评论(2) 收藏
    Java中的对象Object方法之---wait()和notifiy() 分类: Java Android 2014-02-26 08:50 1599人阅读 评论(0) 收藏
    Java中的线程Thread方法之---suspend()和resume() 分类: Java 2014-02-25 14:37 1650人阅读 评论(0) 收藏
    Java中的线程Thread方法之---join() 分类: Android Java 2014-02-25 13:38 1393人阅读 评论(0) 收藏
    Java中的线程Thread方法之---stop() 分类: Java 2014-02-25 09:59 3075人阅读 评论(1) 收藏
    抓包工具Fidder详解(主要来抓取Android中app的请求) 分类: Android 2014-02-24 09:32 10064人阅读 评论(5) 收藏
    XML的解析 分类: JavaWeb Java Android 2014-02-17 18:22 1764人阅读 评论(3) 收藏
    XML文件定义约束 分类: JavaWeb 2014-02-17 17:49 1127人阅读 评论(0) 收藏
    Android中的广播Broadcast详解 分类: Android 2014-02-13 10:59 8414人阅读 评论(5) 收藏
    GitHub错误处理:fatal:could not read Username for 'https://github.com': No such file or directory 分类: Java 2014-02-11 19:39 2346人阅读 评论(0) 收藏
  • 原文地址:https://www.cnblogs.com/cgli/p/1944772.html
Copyright © 2011-2022 走看看