zoukankan      html  css  js  c++  java
  • lucene.net常见问题

    好久没有搞Lucene.net啦,今天整理硬盘资料,发现自己以前写的搜索引擎框架,里面有个文档整理了一些知识点,整理了部分发表出来,希望对研究Lucene.net的有缘人能有所帮助:

    问:Lucene.net的搜索结果的百分比相关度值是如何实现的?
    答:
        Hits result = searcher.Search(q);
        float score = result.Score(n) ;//n为查询结果文挡序号,返回的是一个<=1f的float的值,表示为百分比字符串:score.ToString("0%") ;

    问:如何通过编程的方式改变Lucene.net的锁文件存放的位置?
    答:
        Lucene.net的锁文件默认是存放系统临时文件夹,可以通过下面的语句来修改
        System.Configuration.ConfigurationSettings.AppSettings.Add("Lucene.Net.lockDir", "your new lockDir") ;
        通过FSDirectory.LOCK_DIR可以获得锁文件存放的位置(文件夹)
       
    问:如何判断某个索引库被锁定,如何强制解除锁定?
    答:
       具体实现,可以参看Lucene.Net.Store.FSDirectory的Obtain()(判断是否锁定)方法和Release()方法(解除锁定)  
       备注:还有一个IsLocked方法也可以参考下。
      
    问:如何实现多个索引的联合搜索 ?
    答:
       IndexSearcher[] searchers = new IndexSearcher[2];
       searchers[0] = new IndexSearcher(dir1) ;
       searchers[1] = new IndexSearcher(dir2) ;
      
       MultiSearcher searcher = new MultiSearcher(searchers) ;//或ParallelMultiSearcher searcher = new ParallelMultiSearcher(searchers) ;
       searcher.Search(query) ;
      
       ParallelMultiSearcher与MultiSearcher的区别,前者为每一个索引单独开一个线程,以多线程的方式同步搜索;后者是逐个依次搜索,然后合并;
       所以ParallelMultiSearcher的搜索总用时是最慢的哪个索引的搜索用时,MultiSearcher则是搜索总用时等于所有索引搜索用时之和;
      
    问:如何实现在结果中搜索 ?
    答:
        *方法一,使用CachingWrapperFilter。不能实现无限级的“在结果中搜索”:
        QueryParser parser = new QueryParser("content", analyzer);
       
        Query currentQuery = parser.Parse(currentKeyword) ;
     Query oldQuery = parser.Parse(oldKeyword) ;

     QueryFilter oldFilter = new QueryFilter(oldQuery) ;
     CachingWrapperFilter filter = new CachingWrapperFilter(oldFilter) ;
     
     IndexSearcher searcher = new IndexSearcher(indexDir);
     
     Hits result = searcher.Search(currentQuery, filter) ;
     
     *方法二,将多个查询关键词做AND的BooleanQuery或者直接构造查询Sytax传给QueryParser,都可以实现无限级的“在结果中搜索“。
     
    问:BooleanQuery.maxClauseCount的含义 ?
    答:
        添加到BooleanQuery的最多的Query数,默认是1024。超过该值会抛出TooManyClauses异常,可以通过BooleanQuery.SetMaxClauseCount(int)设置新的值。

        备注:含义解释未明确。

    问:如何判断一个索引库是否存在?
    答:
       string indexPath = "your indexPath" ; //索引所在目录
       if (System.IO.Directory.Exists(indexPath) && System.IO.File.Exists(Path.Combine(indexPath,"segments")
          //存在
       else
          //不存在
      
       当然有更直接的方法
       if (Lucene.Net.Index.IndexReader.IndexExists(indexPath))
         //存在
       else
         //不存在
        
       Lucene.Net.Index.IndexReader.IndexExists方法内部的实现方式和上面的类似,当然直接用Lucene.Net.Index.IndexReader.IndexExists更可靠些。

  • 相关阅读:
    2017-2018-2 20155234『网络对抗技术』Exp5:MSF基础应用
    20155234 exp4 恶意代码分析
    20155234 Exp3 免杀原理与实践
    20155234 Exp2 后门原理与实践
    20155234 昝昕明 《网络对抗技术》实验一 PC平台逆向破解
    20165232 第二周学习总结
    # 2017-2018-2 20155231《网络对抗技术》实验九: Web安全基础实践
    2017-2018-2 20155231《网络对抗技术》实验八: WEB基础实验
    2017-2018-2 20155231《网络对抗技术》实验五: MSF基础应用
    2017-2018-2 20155231《网络对抗技术》实验七: 网络欺诈防范
  • 原文地址:https://www.cnblogs.com/twilight/p/1579793.html
Copyright © 2011-2022 走看看