zoukankan      html  css  js  c++  java
  • SharePoint 2010 Search的新特性

    面对搜索的终端用户的新特性

    =======================

    • 返回搜索结果更加快速
    • 对搜索结果的关键字相关性进行了增强
    • 新的界面元素
    • 更加social的搜索体验
    • Boolean query syntax for freetext queries and for property queries
    • 对于搜索关键字和文档属性的前缀匹配功能
    • 键入搜索关键字时提供建议
    • 执行搜索之后提供建议
    • 与Windows 7中的enterprise search的桥接
    • 对搜索结果显示的增强
    • People Search
      • 更简单地确定你是否找到了要找的人
      • 更简单地联系到被搜索的人, 更容易找到他的文档
      • 能根据更加广泛的数据来搜索人
      • 拼音名和昵称匹配

    面对IT professional的新特性

    ===================

    SharePoint 2010中已不存在一个单独的地方来配置和管理所有的共享服务了. 现在, 每个单独的共享服务应用(Shared Service Application)都彼此分开.

    这样的架构的好处:

    1. 更容易管理

    2. 避免了建立不需要的服务

    3. 对一个共享服务应用的排错不会影响到其他的无关服务.

    除了上面的这些, SharePoint 2010中的search系统还提供了更加强大的环境支持.

    1. 增强了可扩展性和可冗余性.

    现在SharePoint 2010提供了创建多个查询角色, 多个索引角色, 多个搜索数据库的能力. 这些组件之间拥有failover的机制来避免当一台服务器挂掉后, 搜索服务的当机时间. 注意, 这些组件之间没有负载均衡(load balancing).

    2. 多个数据库和组件.

    多个索引组件和爬网数据库

    当我们创建了多个爬网角色之后, 这些爬网角色可以被指定到不同的索引服务器上, 从而加快制作索引的速度. 在一台机器挂掉之后, 这些索引组件之间还提供了自动化的failover. 现在indexing的过程自己有一个单独的数据库, 从而与query的过程进行了分离. 分离之后, 就防止了query和indexing之间彼此影响性能. 多个indexing 数据库也可以提高索引的性能和可扩展性. 下图显示了可以扩展组件和数据库的途径.

    image

    多个索引组件和索引数据库

    查询的延迟问题被提高了很多, 因为现在管理员可以将索引拆开或是添加更多的存储property的数据库. 添加额外的索引服务器也可以提供给我们可靠的failover机制.

    主机分配规则(host distribution rules)

    这是SharePoint 2010的新特性, 它允许管理员指定那台crawl component或crawl database处理和存储来自某台特定主机的URL. 这提供管理员根据自己的判断来负载均衡URL的能力.

    Profile Import不再依赖于搜索功能了

    现在import user的时候不再依赖于search了, 所以它不会影响到crawling system.

    Connector的架构(framework)

    SharePoint 2010中创建Connector很容易. Connector是帮助index某项content的. 使用connector framework来创建一个connector比写一个protocol handler要容易得多, 它也极大地降低了从没有protocol handler的内容源中获取内容的门槛. 同样, connector也使用change log来进行增量爬网.

    Connector framework现在被用来索引从前需要protocol handler才能索引的内容源.

    SharePoint 2010自带的protocol handler包括:

    · Exchange

    · Notes

    · EMC Documentum

    · IBM File Net

    · Open Text

    更好的日志

    现在增强了爬网日志可以使得管理员更容易地:

    • 确定某个页面是否被爬过
    • 通过主机名来分别查看错误, 成功, 和警告信息.
    • 过滤, 排序, 搜索日志
    • 某个item被阻止放在搜索结果中的时候, 日志中会有记录
    • 重新爬某个项目的时候, 会有记录
  • 相关阅读:
    第12章,存储类别、链接和内存管理
    第11章 字符串和字符串函数
    第10章 数组和指针
    第9章 函数
    第8章 字符输入/输出和输入验证
    第7章,c语言控制语句:分支和跳转
    第六章,处语言控制语句:循环
    中国互联网发展史
    世界互联网发展史
    世界计算机发展史
  • 原文地址:https://www.cnblogs.com/awpatp/p/2042152.html
Copyright © 2011-2022 走看看