zoukankan      html  css  js  c++  java
  • ElasticSearch查询 第五篇:布尔查询

    《ElasticSearch查询》目录导航:

    布尔查询是最常用的组合查询,不仅将多个查询条件组合在一起,并且将查询的结果和结果的评分组合在一起。当查询条件是多个表达式的组合时,布尔查询非常有用,实际上,布尔查询把多个子查询组合(combine)成一个布尔表达式,所有子查询之间的逻辑关系是与(and);只有当一个文档满足布尔查询中的所有子查询条件时,ElasticSearch引擎才认为该文档满足查询条件。布尔查询支持的子查询类型共有四种,分别是:must,should,must_not和filter:

    • must子句:文档必须匹配must查询条件;
    • should子句:文档应该匹配should子句查询的一个或多个;
    • must_not子句:文档不能匹配该查询条件;
    • filter子句:过滤器,文档必须匹配该过滤条件,跟must子句的唯一区别是,filter不影响查询的score;

    通常情况下,should子句是数组字段,包含多个should子查询,默认情况下,匹配的文档必须满足其中一个子查询条件。如果查询需要改变默认匹配行为,查询DSL必须显式设置布尔查询的参数minimum_should_match的值,该参数控制一个文档必须匹配的should子查询的数量,我遇到一个布尔查询语句,其should子句中包含两个查询,如果不设置参数minimum_should_match,其默认值是0。建议在布尔查询中,显示设置参数minimum_should_match的值。

    注:布尔查询的四个子句,都可以是数组字段,因此,支持嵌套逻辑操作的查询。

    例如,对于以下should查询,一个文档必须满足should子句中两个以上的词条查询:

    复制代码
    "should" : [
            {  "term" : { "tag" : "azure" } },
            {  "term" : { "tag" : "elasticsearch" } },
            {  "term" : { "tag" : "cloud" } }
        ],
    "minimum_should_match" : 2
    复制代码

    布尔查询的各个子句之间的逻辑关系是与(and),这意味着,一个文档只有同时满足所有的查询子句时,该文档才匹配查询条件,作为结果返回。

    在布尔查询中,对查询结果的过滤,建议使用过滤(filter)子句和must_not子句,这两个子句属于过滤上下文(Filter Context),经常使用filter子句,使得ElasticSearch引擎自动缓存数据,当再次搜索已经被缓存的数据时,能够提高查询性能;由于过滤上下文不影响查询的评分,而评分计算让搜索变得复杂,消耗更多CPU资源,因此,filter和must_not查询减轻搜索的工作负载。

    一,查询和过滤上下文

    在布尔查询中,查询被分为Query Context 和 Filter Context,查询上下文由query参数指定,过滤上下文由filter和must_not参数指定。这两个查询上下文的唯一区别是:Filter Context不影响查询的评分(score)。在布尔查询中,Filter参数和must_not参数使用Filter Context,而must和should使用Query Context,经常使用Filter Context,引擎会自动缓存数据,提高查询性能。

    复制代码
    GET _search
    {
      "query": { 
        "bool": { 
          "must": [
            { "match": { "title":   "Search"        }}, 
            { "match": { "content": "Elasticsearch" }}  
          ],
          "filter": [ 
            { "term":  { "status": "published" }}, 
            { "range": { "publish_date": { "gte": "2015-01-01" }}} 
          ]
        }
      }
    }
    复制代码

    对于上述查询请求,must子句处于query context中,filter子句处于filter context中:

    • 在query context中,must子句将返回同时满足匹配(match)查询的文档;
    • 在filter context中,filter子句是一个过滤器,将不满足词条查询和范围查询条件的文档过滤掉,并且不影响匹配文档的score;

    二,布尔查询子句的逻辑关系

    在布尔查询中,各个子句之间的逻辑关系是与(and)。对于单个子句,只要一个文档满足该子句的查询条件,返回的逻辑结果就是true,而对于should子句,它一般包含多个子查询条件,参数 minimum_should_match 控制文档必须满足should子句中的子查询条件的数量,只有当文档满足指定数量的should查询条件时,should子句返回的逻辑结果才是true。

    复制代码
    {
        "bool" : {
            "must" : {
                "term" : { "user" : "kimchy" }
            },
            "filter": {
                "term" : { "tag" : "tech" }
            },
            "must_not" : {
                "range" : {
                    "age" : { "from" : 10, "to" : 20 }
                }
            },
            "should" : [
                {  "term" : { "tag" : "wow" } },
                {  "term" : { "tag" : "elasticsearch" } }
            ],
            "minimum_should_match" : 1
        }
    }
    复制代码

    在上述布尔查询中,should子句中包含两个词条查询,由于参数 minimum_should_match的值是1,因此,只要一个稳定满足任意一个词条查询的条件,should子句就匹配成功,返回逻辑结果true,然后和其他子查询进行逻辑运算,只有当该文档满足所有的子查询条件时,才作为查询结果返回到客户端。

    三,布尔查询示例分析

    1,使用布尔查询实现简单的逻辑查询

    在下述示例中,分析布尔查询的运算逻辑:

    • must子句和should子句之间的逻辑关系是and;
    • must子句包含一个匹配查询,字段eventname必须包含style词条;
    • should子句是一个数组,包含两个匹配查询,文档必须匹配的子句查询条件数量由参数 minimum_should_match控制;
    • 参数 minimum_should_match的值是1,这就意味着,一个文档只要满足任意一个查询子句,就匹配should子句;
    复制代码
    {  
       "query":{  
          "bool":{  
             "must":{  
                "match":{  "eventname":"style" }
             },
             "should":[  
                { "match":{ "eventname":"google" } },
                { "match":{  "eventname":"aws" }}
             ],
             "minimum_should_match":1
          }
       }
    }
    复制代码

    通过上述分析,以下字段值满足查询条件:

    • "eventname": "Google style map"
    • "eventname": "AWS Game Day ~ Seattle Style!"

    2,使用布尔查询实现复杂的分组查询

    复杂的分组查询,例如:(A and B) or (C and D) or (E and F) ,把布尔查询作为should子句的一个子查询:

    复制代码
    {
      "_source": "topics",
      "from": 0,
      "size": 100,
      "query": {
        "bool": {
          "should": [
           {
              "bool": {
                "must": [
                  { "term": { "topics": 1}  },
                  { "term": { "topics": 2}  }
                ]
              }
            },
            {
              "bool": {
                "must": [
                  {"term": { "topics": 3 } },
                  {"term": { "topics": 4}}
                ]
              }
            }
          ],
          "minimum_should_match": 1
        }
      }
    }
    复制代码

    参考文档:

    Elasticsearch Reference [2.4] » Query DSL » Compound queries » Bool Query

  • 相关阅读:
    hdu 4403 枚举
    hdu 4405概率dp
    lightoj 1036 dp
    lightoj 1033 区间dp
    lightoj 1032 二进制的dp
    hdu 4293 dp求最大权值不重合区间
    poj 2449 第k短路
    hdu 4284 状态压缩
    hdu4281 区间dp
    poj 2288 tsp经典问题
  • 原文地址:https://www.cnblogs.com/zxtceq/p/7691016.html
Copyright © 2011-2022 走看看