zoukankan      html  css  js  c++  java
  • lucene-SpanFirstQuery 和SpanNearQuery 跨度查询

    1、SpanFirstQuery查询

    对出现在一个域中前n个位置的跨度查询。

    public void testSpanFirstQuery() throws Exception{

        SpanzFirtsQuery sfq=new SpanFirstQuery(brown,2);

        assertNoMatches(sfq);//前2个位置的跨度无法匹配

        sfq=new SpanFirstQuery(brown,3);

        assertOnlyBrownFox(sfq);//前3个位置匹配成功

    }

    域内容为

    the quick brown fox ......

    2、彼此相邻的跨度

          首先,强调一下PhraseQuery对象,这个对象不属于跨度查询类,但能完成跨度查询功能。

          匹配到的文档所包含的项通常是彼此相邻的,考虑到原文档中在查询项之间可能有一些中间项,或为了能查询倒排的项,PhraseQuery设置了slop因子,但是这个slop因子指2个项允许最大间隔距离,不是传统意义上的距离,是按顺序组成给定的短语,所需要移动位置的次数这表示PhraseQuery是必须按照项在文档中出现的顺序计算跨度的,如quick brown fox为文档,则quick fox2个项的slop为1,quick向后移动一次.而fox quick需要quick向后移动3次,所以slop为3

          其次,来看一下SpanQuery的子类SpanTermQuery。

          它能跨度查询,并且不一定非要按项在文档中出现的顺序,可以用一个独立的标记表示查询对象必须按顺序,或允许按倒过来的顺序完成匹配。匹配的跨度也不是指移动位置的次数,是指从第一个跨度的起始位置到最后一个跨度的结束位置。

          在SpanNearQuery中将SpanTermQuery对象作为SpanQuery对象使用的效果,与使用PharseQuery的效果非常相似。 在SpanNearQuery的构造函数中的第三个参数为inOrder标志,设置这个标志,表示按项在文档中出现的顺序倒过来的顺序。

          如:the quick brown fox jumps over the lazy dog这个文档

          public void testSpanNearQuery() throws Exception{

               SpanQuery[] quick_brown_dog=new SpanQuery[]{quick,brown,dog};

               SpanNearQuery snq=new SpanNearQuery(quick_brown_dog,0,true);//按正常顺序,跨度为0,对三个项进行查询

               assertNoMatches(snq);//无法匹配

               SpanNearQuery snq=new SpanNearQuery(quick_brown_dog,4,true);//按正常顺序,跨度为4,对三个项进行查询

               assertNoMatches(snq);//无法匹配

               SpanNearQuery snq=new SpanNearQuery(quick_brown_dog,4,true);//按正常顺序,跨度为5,对三个项进行查询

               assertOnlyBrownFox(snq);//匹配成功    

               SpanNearQuery snq=new SpanNearQuery(new SpanQuery[]{lazy,fox},3,false);//按相反顺序,跨度为3,对三个项进行查询

               assertOnlyBrownFox(snq);//匹配成功   

               //下面使用PhraseQuery进行查询,因为是按顺序,所以lazy和fox必须要跨度为5

               PhraseQuery pq=new PhraseQuery();

               pq.add(new Term("f","lazy"));

               pq.add(new Term("f","lazy"));

               pq.setslop(4);

               assertNoMatches(pq);//跨度4无法匹配

               //PharseQuery,slop因子为5

               pq.setSlop(5);

               assertOnlyBrownFox(pq);          

          }

  • 相关阅读:
    深浅拷贝的区别
    vue中动态加载组件
    一些工具软件
    echarts 自传作品入口
    Echarts progress 设置背景颜色
    Echarts柱状图,柱子设置不一样的渐变色
    .net 控制台学习笔记 一、控制台程序的异常捕获
    IdentityServer4实战:自定义用户名和密码校验
    IdentityServer4实战:Token 中返回用户属性
    IdentityServer4实战:持久化 Resource
  • 原文地址:https://www.cnblogs.com/1130136248wlxk/p/5031092.html
Copyright © 2011-2022 走看看