zoukankan      html  css  js  c++  java
  • 发布全文检索类库外包

    因时间紧张,现将全文检索类库外包,需求如下,有意者可详细沟通。

    全文检索类库需求说明

    操作系统环境:

             Windows 2003 + IIS 6

            

    IDE开发环境:

             VS 2008 + C# 3.5 + lucene.net (或者其他)

    技术要求:

             符合高并发需求,可满足同时300以上个搜索的请求(内存,IO,通讯传输量)。

         读写分离策略(可以采用队列 + 定时器的模式更新索引)

       更新策略,与上面相同,可以有一天的延迟。

       中英文分词

             避免大量的 IO,可以采取适当的缓存技术,网站有分布式缓存,最好一个文件块每天只发起一次 IO。

             排序策略:排序策略有多种因子,排序因子可调

            按相关性搜索排序之后,还会有对站内积分规则的二次排序过滤。

             搜索策略,可拓展搜索接口。

             避免内存泄露问题

    需求说明:

        全文检索只需要提供相应的接口和策略,操作到指定的文件块即可。

        全文检索共分为三块业务:

             产品的搜索,带有商户和产品的排序策略,产品的显示和搜索都从全文库发起。

             帮助的搜索,英文帮助和中文帮助的搜索,这两块部分都不是很大,可以直接缓存。

             中文,英文分词

             索引库在单独的服务器,多个 WEB 服务器对索引库服务器请求搜索,服务器在一个局域网内,光纤网卡连接。

  • 相关阅读:
    IDEA创建一个javaweb工程(在module中)以及配置Tomcat
    晨会复盘
    cnblog 笔记思路
    Mysql执行计划-extra
    Mysql执行计划分析-type(access_type)
    Mysql执行计划-selectType
    刻意训练
    MYSQL执行计划
    个人展望-程序员职业规划
    服务拆分原则
  • 原文地址:https://www.cnblogs.com/leveret/p/1774373.html
Copyright © 2011-2022 走看看