zoukankan      html  css  js  c++  java
  • 如何禁止搜索引擎收录抓取

    第一种、robots.txt方法

    搜索引擎默认的遵守robots.txt协议,创建robots.txt文本文件放至网站根目录下,编辑代码如下:

    User-agent:*
    Disallow:

    通过代码,即可告诉搜索引擎不要抓取采取收录本网站。

    第二种、网页代码

    在网站首页代码<head>与</head>之间,加入<metaname="robots"content="noarchive">代码,此标记禁止搜索引擎抓取网站并显示网页快照。

    如何禁止百度搜索引擎收录抓取网页

    1、编辑robots.txt文件,设计标记为:

    User-agent:Baiduspider
    Disallow:/

    2、在网站首页代码<head>与</head>之间,加入<metaname="Baiduspider"content="noarchive">即可禁止百度搜索引擎抓取网站并显示网页快照。

    3、联系百度管理人员,信箱地址为:webmaster@baidu.com,用网站联系人信箱发电邮,如实说明删除网页快照的情况,经百度核实后,网页停止收录抓取。

    4、登陆百度自己的“百度快照”帖吧和“百度投诉”帖吧,发个帖子,表明删除网页收录网站快照的原因,当百度管理人员,看到会给予处理。

    如何禁止Google搜索引擎收录抓取网页

    1、编辑robots.txt文件,设计标记为:

    User-agent:googlebot
    Disallow:/

    2、在网站首页代码<head>与</head>之间,加入<metaname="googlebot"content="noarchive">即可禁止百度搜索引擎抓取网站并显示网页快照。

    本文摘自:SEO优化: 侯庆龙原载网址:www.noseo.org.cn

  • 相关阅读:
    Linux实用命令之git-svn
    Linux实用命令之xdg-open
    记一个logrotate的配置文件权限问题
    日常开发技巧:x11-forward,使用远程机器的gui程序
    【机器学习】PCA
    【PyTorch】Tricks 集锦
    【Python】itertools之product函数
    强化学习——值迭代和策略迭代
    PyTorch中MaxPool的ceil_mode属性
    猫狗识别——PyTorch
  • 原文地址:https://www.cnblogs.com/xiaomifeng/p/4548681.html
Copyright © 2011-2022 走看看