zoukankan      html  css  js  c++  java
  • Sharepoint2013搜索学习笔记之搜索构架简单概述(一)

      Sharepoint搜索引擎主要由6种组件构成,他们分别是爬网组件,内容处理组件,分析处理组件,索引组件,查询处理组件,搜索管理组件。可以将这6种组件分别部署到Sharepoint场内的多个服务器上,组成适合需求的Sharepoint搜索场,搜索场的体系结构设计主要参考量是爬网内容量,微软根据爬网内容量不同将搜索场分为大型场,中型场和小型场,更多详细信息可参考: SharePoint Server 2013 中的搜索概述在SharePoint Server 2013 中规划企业搜索体系结构

                  Sharepoint搜索引擎构架图

    内容量

    搜索体系结构

    0 - 1000 万个项

    小型搜索服务器场

    1000 万 - 4000 万个项

    中型搜索服务器场

    4000 万 - 1 亿个项

    大型搜索服务器场

      下图为一个小型搜索拓扑的例子,据微软测试可以支持1000万个项目,并测量出它每秒可以爬网 50 个文档,且每秒服务 10 个查询。对于每秒 50 个文档的爬网率,首次完全爬网中,需要搜索 55 个小时来爬网 1000 万个项目。

    小型场服务器拓扑

     

    以下为这个小型场的硬件需求说明:

    机服务器

    应用程序或数据库服务器

    存储量

    RAM

    处理器

    A、B

    带有查询处理和索引组件的应用程序服务器

    500 GB

    16 GB

    1.8 GHz 4x CPU 内核

    A、B

    带有爬网、搜索管理、分析和内容处理组件的应用程序服务器。

    200 GB

    8 GB

    1.8 GHz 4x CPU 内核

    A、B

    带有所有搜索数据库的数据库服务器。

    100 GB

    16 GB

    1.8 GHz 4x CPU 内核

    搜索组件说明:

    搜索组件名称

    说明

    爬网组件

    对内容源进行爬网可从已爬网项目中收集已爬网属性和元数据,并将此信息发送到内容处理组件

    内容处理组件

    转换已爬网项目并将其发送到索引组件。此组件还会将已爬网属性映射到托管属性

    分析处理组件

    执行搜索分析和使用情况分析

    索引组件

    从内容处理组件中搜索已处理的项目并将其写入搜索索引。此组件还可以处理传入查询、从搜索索引中检索信息并将结果集发送回查询处理组件

    查询处理组件

    分析传入查询。这有助于提高精确度、改进检索和提高相关性。查询将发送到索引组件,该组件将为查询返回一组搜索结果

    搜索管理组件

    运行搜索的系统进程,添加并初始化搜索组件的新实例

    搜索数据库说明:

    搜索数据库名称

    说明

    爬网数据库

    存储跟踪信息和有关已爬网项目(如文档和 URL)的历史信息。还将存储上一次爬网时间、上一次爬网 ID 和上一次爬网期间的更新类型(添加、更新、删除)等信息。

    链接数据库

    存储由内容处理组件提取的未处理信息和有关搜索单击的信息。分析处理组件将分析此信息。

    分析报告数据库

    存储使用情况分析的结果。

    搜索管理数据库

    存储搜索配置数据

  • 相关阅读:
    百度地图根据经纬度计算瓦片行列号
    【完全开源】百度地图Web service API C#.NET版,带地图显示控件、导航控件、POI查找控件
    TCP/UDP简易通信框架源码,支持轻松管理多个TCP服务端(客户端)、UDP客户端
    重中之重:委托与事件
    可复用代码:组件的来龙去脉
    [史上最全]C#(VB.NET)中位运算符工作过程剖析(译)
    物以类聚:对象也有生命
    导入导出Android手机文件
    Android修改system只读权限
    SSHDroid(SSH Server for Android)通过PC或命令连接android
  • 原文地址:https://www.cnblogs.com/masterlonely/p/3824586.html
Copyright © 2011-2022 走看看