zoukankan      html  css  js  c++  java
  • MOSS2007中型服务场配置 教材<05>:配置SSP爬网计划

    1、 之前第四节教材中,我们已经创建了共享服务提供Shared Services Provider(简称SSP)

    ,并且取名为SSP_HNAREA。这一节,我们接着讲如何配置SSP的执行爬网计划。首先,打开管理中心Central Administration,单击应用程序管理Application Managerment,

    ,单击选项Create or configure this farm’s shared services。或者直接单击面板右侧的选项

    Shared Services Administration中的SSP对象。

    clip_image002

    2、打开SSP管理设置界面,选择和单击要设置的SSP对象。

    clip_image004

    弹出该SSP_HNAREA的设置主界面,并且单击选项“Search”à”Search Settings”。

    clip_image006

    3、 在如下界面中,我们单击选项“Content sources and crawl schedules”(内容源和爬网计划)

    ,进行内容源和爬网计划的创建和设置。

    clip_image008

    4、单击“New Content Source”选项,创建一个内容源,并且设置派往计划:

    设置数据源名称、选择被爬网的内容的类型、爬网的开始地址。(注意:这里我输入的http://gdip.itshare.com/sites/UserPortal,其实是错误的,只需要输入最上面的开始地址,即可。

    clip_image010

    5、接下来,我们要设置参数”Crawl Settiings”、”Crawl Schedules”,

    Crawl Settings有两种方式:爬网范围为整个开始地址的网站的全部内容,和爬网范围为开始抵制的网站的网站首页。

    clip_image012

    6、设定完整爬网:单击”Full Crawl”下面的选项”Create Schedules”,创建一个爬网计划。设置参数,可以参考实际情况和网路使用情况以及系统访问负担情况来考虑设定。

    clip_image014

    7、设定增量爬网:单击”Incremental Crawl”下面的选项”Create Schedules”,创建一个爬网计划。设置参数,可以参考实际情况和网路使用情况以及系统访问负担情况来考虑设定。

    clip_image016

    8、最后,你可以选中勾上“Start full crawl for this content source”来手动启动本次的完整爬网计划。

    clip_image018

    单击按钮“确定”,便开始完整爬网。如下图。

    clip_image020

    附:

    大家也可以尝试使用Search Settings的其他功能选项,比如“Metadata property mapping”(映射属性)来了解爬网的搜索内容。

  • 相关阅读:
    resolv.conf 是什么
    Cloudera Manager Free Edition 4.1 和CDH 4.1.2 简易安装教学
    bach cello
    windows 7 旗舰版 切换 中英文 界面
    geghi 教程 以lesmiserable 为例
    python 使用 tweepy 案例: PS4
    用Live Writer写博文插入程序代码的三个插件比较
    侧滑菜单
    [Android]简略的Android消息机制源码分析
    常用git命令
  • 原文地址:https://www.cnblogs.com/itshare/p/2230724.html
Copyright © 2011-2022 走看看