因时间紧张,现将全文检索类库外包,需求如下,有意者可详细沟通。
全文检索类库需求说明
操作系统环境:
Windows 2003 + IIS 6
IDE开发环境:
VS 2008 + C# 3.5 + lucene.net (或者其他)
技术要求:
符合高并发需求,可满足同时300以上个搜索的请求(内存,IO,通讯传输量)。
读写分离策略(可以采用队列 + 定时器的模式更新索引)
更新策略,与上面相同,可以有一天的延迟。
中英文分词
避免大量的 IO,可以采取适当的缓存技术,网站有分布式缓存,最好一个文件块每天只发起一次 IO。
排序策略:排序策略有多种因子,排序因子可调
按相关性搜索排序之后,还会有对站内积分规则的二次排序过滤。
搜索策略,可拓展搜索接口。
避免内存泄露问题
需求说明:
全文检索只需要提供相应的接口和策略,操作到指定的文件块即可。
全文检索共分为三块业务:
产品的搜索,带有商户和产品的排序策略,产品的显示和搜索都从全文库发起。
帮助的搜索,英文帮助和中文帮助的搜索,这两块部分都不是很大,可以直接缓存。
中文,英文分词
索引库在单独的服务器,多个 WEB 服务器对索引库服务器请求搜索,服务器在一个局域网内,光纤网卡连接。