zoukankan      html  css  js  c++  java
  • (转)利用Lucene.net搜索引擎进行多条件搜索的做法

    本文转载自:http://blog.csdn.net/hehui21/article/details/2874113

     Lucene.net是目前在.net环境中被普遍使用的全文索引的开源项目,这次在项目的开发中也使用它进行全文索引。
    在开发过程中碰到一些小问题就是对多字段和多索引目录进行搜索。


    1 联合两个索引查询,已解决: 
    IndexSearcher[] searchers = new IndexSearcher[2];  
       
    searchers[0] = new IndexSearcher(m_indexpath); 
    searchers[1] = new IndexSearcher(m_outindexpath); 

    MultiSearcher multiSearcher = new MultiSearcher(searchers); 

    2,还有个进行多条件搜索 and 与 or 的操作———— 
    用 MultiFieldQueryParser 
    建议重新封装 
    MultiFieldQueryParser.Parser(p[],d[],f[],analyer)  成or 与 and操作合一 
    或者 
    BooleanQuery m_BooleanQuery = new BooleanQuery(); 
    Query query = QueryParser.Parse(m_SearchText, "INSTRUMENT_NAME", analyzer); 
    Query query2 = QueryParser.Parse(m_SearchText2, "INSTRUMENT_NAME2", analyzer); 
    m_BooleanQuery.Add(query, true, false); 
    m_BooleanQuery.Add(query2, true, false);
    3,进行详细解释每个步骤


    1、多字段搜索就是同时要一个以上的字段中的内容进行比较搜索,

    Lucene.net中的单个字段查询大家都比较熟悉,这里对字段content进行搜索
    Query query = QueryParser.Parse(querystr,"content",new ChineseAnalyzer());
    Hits hits = searcher.Search(query);

    对多个字段查询用到一个MultiFieldQueryParser对象,该对象继承自Query,我们要对字段title,content进行搜索。
    string[] fields = {"content","title"};
    Query multiquery = MultiFieldQueryParser.Parse(querystr,fields,new ChineseAnalyzer());
    Hits hits = searcher.Search(multiquery);

    2、多索引目录就是要在多个索引目录的中进行比较搜索,
    IndexSearcher[] searchers = new IndexSearcher[2];
    searchers[0] = new IndexSearcher(IndexPath0);
    searchers[1] = new IndexSearcher(IndexPath1);

    MultiSearcher multisearcher = new MultiSearcher(searchers);
    TopDocs multitopdocs = multisearcher.Search(query, null, 1000);
    这个搜索的结果可能有相同的信息,比如你有一条相同的信息在多个目录中索引,搜索的结果就会出现多次相同的信息。

    还有一种搜索方式是用到ParallelMultiSearcher这个对象,它是从MulitSearcher继承而来。
    ParallelMultiSearcher parallelmultisearcher = new ParallelMultiSearcher(searchers);
    TopDocs paralleltopdocs = parallelmultisearcher.Search(query, null, 1000);
    这个搜索是对搜索后的结果进行合并,剔除重复的信息。

  • 相关阅读:
    NOIP2016——组合数问题
    BZOJ3450——Tyvj1952(OSU?)
    洛谷4316——绿豆蛙的归宿(期望)
    BZOJ1997——次小生成树(严格次小生成树)
    USACO2002-OPEN-GREEN(GREEN秘密的牛奶管道SECRET)
    Linux系统应急响应
    Linux系统登录相关
    (翻译)Attacking Interoperability(攻击互操作性)in Black Hat 2009 研究报告
    HTTP参数污染(HPP)漏洞
    逻辑漏洞之越权访问漏洞
  • 原文地址:https://www.cnblogs.com/wpcnblog/p/2383554.html
Copyright © 2011-2022 走看看