zoukankan
html css js c++ java
创建爬网规则
创建爬网规则
当创建完内容源后,即可进行Full Crawl(完全爬网),当然你也可以创建爬网规则,
比如我目前需要爬Skyrim:36405 中两个Document Library(Approval和Documents),其他不需要被爬网
,可以这样设置:
注意爬网规则的顺序,比如将http://skyrim:36405/*.* 放在第一位,那么后2条爬网规则将不起作用,具体你可以键入某个URL,然后单击"测试"以了解是否符合规则,如下图所示:
查看全文
相关阅读:
.Net关闭数据库连接时判断ConnectionState为Open还是Closed?
Excel里生成GUID
Convert.ChangeType不能处理Nullable类型的解决办法
xml编辑无提示?这么破!
如何往eclipse中导入maven项目
巧用浏览器F12调试器定位系统前后端bug
Web自动化selenium技术快速实现爬虫
Git一分钟系列--快速安装git客户端
web自动化原理揭秘
Web自动化测试环境搭建1(基于firefox火狐浏览器)
原文地址:https://www.cnblogs.com/914556495wxkj/p/3564982.html
最新文章
kubernetes 调度相关
kubernetes生态圈
kubernetes master 高可用一键部署
prometheus报警消息钉钉通知
kubernetes daahboard权限限制
kubernetes 阿里云安装(kubeadm方式)
kubernetes健康检查
kubeernetes节点资源限制
kubernetes 命令记录
缓冲区溢出的问题
热门文章
jave ee之 servlet 记录
C++模板分离
Effective C++ 笔记2(构造,析构,赋值)
消息队列之ZeroMQ(C++)
多线程之信号量(By C++)
多线程之互斥锁(By C++)
Effective C++ 笔记1
C++ 代码优化
机器学习之K-近邻算法
尽量用goto代替尾递归
Copyright © 2011-2022 走看看