Robots.txt在项目中的运用 - 走看看

zoukankan html css js c++ java

Robots.txt在项目中的运用
在开发公司一个项目的过程中，有这样一个需求

该网站上面有一个search功能，可以search该网站上的任何包括特定内容的网页

现在有一个需求，就是针对几个特定的页面，我们希望网站上的search功能查找不到它们，同时呢，还需要搜索引擎(比如 google, bing等)无法搜索到这几个页面

关于网站上自带的search功能查找不到这几个网页，在后台使用C#代码就可以实现

而如何来确保搜索引擎(eg: google, bing等)无法搜索到这几个页面，如何实现呢

我采取的是使用Robots.txt来实现

Robots.txt原来的内容如下:
User-agent: * Sitemap: https://mysite.com/sitemap.xml
这个表示任何搜索引擎，抓取工具的用户代理都可以访问这个网站的所有页面资源. 网站的地图文件位于 https://mysite.com/sitemap.xml
```
假设我们需要针对搜索引擎屏蔽的文件如下:  
```
```
https://mysite.com/mytest1

https://mysite.com/mytest2
```
```
https://mysite.com/mytest3

那么，我们需要修改Robots.txt文件如下
```
User-agent: * Sitemap: https://mysite.com/sitemap.xml disallow: /mytest1 disallow: /mytest2 disallow: /mytest3
这样，就可以确保这三个页面不被任何搜索引擎抓取
查看全文

相关阅读:
计算几何 val.3
项目中常用的19条MySQL优化
 九年测试老鸟给测试新人的6条忠告
 敏捷软件测试常见的七个误区
 JEMTER简单的测试计划
 你真的会搭建测试环境吗？
使用 Fiddler工具模拟post四种请求数据
 性能测试方案及性能测试流程
 Appium的环境搭建和配置
 Python ：编写条件分支代码的技巧

原文地址：https://www.cnblogs.com/wphl-27/p/9705357.html

Copyright © 2011-2022 走看看