zoukankan      html  css  js  c++  java
  • ElasticSearch基本查询

    词条查询 
    这是一个简单查询。它仅 匹配给定字段中包含该词条的稳定,且是2未经分析的确切的词条。 

    “query” :{ 
    “term”:{ 
    “title”:”crime” 



    多词条查询 
    匹配内容中包含某些词条的文档。 

    “query” :{ 
    “terms::{ 
    “tags”:[“novel”,”book”], 
    “minimum_match”:”2”//至少n个匹配 



    mathc_all 
    匹配索引中的所有文件

    常用词查询
        这是在没有使用停用词的情况下,为了提高准确性和相关性而提供的一个解决方案
        该查询会将词组分成高频和低频两组,使用低频查询并计算分数。然后用高频词组查询但不计算分数。
    match查询
        该查询讲query参数中的值拿出来加以分析,然后构建相应的查询
    
        布尔值查匹配查询
            {
                "query":{
                    "match":{
                        "title":{
                            "query" :"crime and punishment",
                            "operator":"and"   -- 连接创建布尔条件的运算符默认or
                            "analyzer" :"",    -- 分析器的名字
                            "fuzziness":"",    -- 构建模糊查询
                            "prefix_length",   -- 控制模糊查询的行为
                            "max_expansions",  -- 同上
                            "zero_terms_query" -- 指定当所有的词条都被分析器移除时,查询的行为。可以为all或者none。默认后者
                                        不反悔或者返回所有文档
                            "cutoff_frequency" -- 将查询分解成两组,一组高频一组低频
                        }
                    }
                }
            }
        mathc_phrase查询
            从分析后的文本中构建短语查询
                {
                "query":{
                    "mathc_phrase" :{
                        "title" :{
                            "query":"crime and punishment",
                            "slop":"1"                    -- 一个整数值,构建短语时,中间允许的未知词条数。默认为0
                            "analyzer":""                 -- 分析时用到的分析器
                        }
                    }
                }
            }
    
    
        match_phrase_prefix查询
            和上类似,增加了两个参数
            {
                "query":{
                    "mathc_phrase" :{
                        "title" :{
                            "query":"crime and punish",   -- 允许最后一个字条只做前缀匹配
                            "slop":"1"                    -- 一个整数值,构建短语时,中间允许的未知词条数。默认为0
                            "analyzer":""                 -- 分析时用到的分析器
                            "max_expansitions" :"20"      -- 控制多少前缀将被重写成最后的词条。?????
                        }
                    }
                }
            }
    
    multi_match
        针对多个字段尽心查询
        {
            "query" :{
                "multi_match":{
                    "query":"crime and punishment",
                    "fileds":["title","otitle"],
                    "use_dis_max":""                  --定义一个布尔值,true时使用析取最大分数查询-默认。false使用不二查询
                    "tie_breaker":""                  -- 在use_dis_max时使用,指定低分数和最高分数之间的平衡          
                }
            }
        }
    
    
    query_String
        本查询支持全部的lucene语法
        A{
            "query":{
                "query_string":{
                    "query":" title:crime^10 + title:punishment -otitle:cat +author:(+Fyodor +dostoevsky)",
                    "default_field":"title"                    --指定默认的查询字段。默认为all,由index.query.default_field指定
                    "allow_lending_wildcard"                   --指定是否允许通配符作为词条的第一个字符,默认true
                    "default_operator"  :""                    --逻辑运算符or and 默认or
                    "lowercase_extend_terms":""                --查询重写是否把词条变成小写,默认为true,意味重写后的词条讲小写
                    "enable_position_increments":""            --指定查询结果中的位置增量是否打开,默认true
                    "fuzzy_max_expansions":"    "              --使用模糊查询时,此参数指定模糊查询可被扩展到的最大词条数,默认50
                    "fuzzy_prefix_length" :                    --指定生成的模糊查询中的前缀的长度。默认0
                    "fuzzy_min_sim" :                          --此参数指定模糊查询的最小相似度,默认0.5
                    "phrase_slop" :""              --指定参数溢出值,默认0.
                    "analyze_wildcard":""                      --指定是否应该分析通配符查询生成的词条,默认false
                    "auto_generate_phrase_queries":""          --指定是否自动生成短语查询,默认为false。
                    "minimum_should_match" :                   --控制有多少生成Boolean should子句必须与文档词条匹配,才能认为是匹配。
                                            可以使百分比,也可以是整数值-个
                    "lenient":" "              --格式方面的失败是否忽略。
                }
            }
        }
        针对多字段的query_string
                {
                    "query_string":{
                        "query":""
                        "fields"[title,otitle]
                    }
                }
    simple_query_string:
        查询使用lucene最新查询解析器之一:SImpleQueryParser
    标识符查询
        仅使用提供的标识符来过滤返回的文档。其针对内部的_uid字段运行,所以不需要启用_id字段
        {
            ”query“:{
                "ids":{
                    "type":"book"
                    "values":["10","11"]
                }
            }
        }
    前缀查询
        t他们指定字段以给定的前缀开始的文档
        {
        ”query":{
            "prefix":{
                "title":"cri"
            }
        }
        }
    fuzzy_like_this查询
        类似more_like_this查询。
        它查找所有与提供的文本类似的文档,与more不同的是,它利用模糊字符串并选择生成的最佳差分词条
        {
            "qury":{
                "fuzzy_like_this":{
                    "fields":[],
                    "like_text":""
                    "ignore_tf:false        --指定在相似度计算期间,是否忽略词频。
                    "max_query_terms"       --指定生成的查询中能包括的最大查询词条书,默认25
                    "min_similarity"        --指定差分词条应该有的最小相似性。默认0.5
                    "prefix_length"         --指定查分词条的公共前缀长度,默认为0
                    ”boost"
                    "analyzer
                }
            }
        }
    fuzzy_like_this_field查询
        和上类似,但是只针对单个字段
    fuzzy查询
        是第三种模糊查询类型,它基于编辑距离算法类匹配文档。很占用CPU
    通配符查询
        在查询中使用*和?等通配符。
    more_like_this查询
        {
            “query":{
                "more_like_this":{
                    "fields" "[],
                    "like_text":""
                    "min_term_freq" :              --最低词频,低于将忽略
                    "percent_terms_to_match"       --百分比,高于才会被认为是类似的
                    "max_query_terms"              --指定生成的查询中能包括的最大查询词条数,默认25
                    "stop_words"                   --
                    "min_doc_freq"                 --包含我能当的最小数目,低于次数目,该词条将被忽略,默认5
                    "max_doc_freq"
                    "min_word_len"                 --单词的最小长度,低于将被忽略
                    ”boost_terms"
                    "boost"
                    "analyzer"
    
                    }
            }
        }
    more_like_this_field查询
        针对单个字段
    范围查询
        gte:>=
        gt: >
        lte:<=
        lt:<
    最大分值查询
        他会生成一个由所有子查询返回的文档组成的并集并将他返回。,这样我们可以控制较低得分的子查询对文档最后得分的影响
        最后得分的计算:
            最高分数的子查询的得分之和,奖赏其余子查询的得分之和乘以tie参数的值
    正则表达式查询
        支持正则
    复合查询
    
        布尔查询
            should
            must
            must_not
            minimum_should_match:
        加权查询
            封装了两个查询,并且降低其中一个查询返回文档的得分。其由三个节点必须定义
                positive: 包含所返回文档得分不会被改变的查询
                negative: 得分将被降低
                negtive_boost 降低negative部分查询得分的加权值
        constant_score查询
            其封装了另一个查询或过滤,并为每一个所封装查询返回的文档返回一个常量得分
        索引查询
            {
                "query":{
                    "indices::{
                        "indices":['library'],--library索引上查询
                        "query" :{
                            "term":{
                                "title":"crime"
                                }
                        },
                        "no_match_query":{--其他索引上查询
                            "term":{
                                "user":"crime"
                            }
                        }
                    }
                }
                }
  • 相关阅读:
    oracle常规操作
    shell 的算数运算
    sed 命令小结
    swing
    索引失效
    poj--1258--Agri-Net(最小生成树)
    CodeForces--626C--Block Towers (二分)
    Codeforces--629A--Far Relative’s Birthday Cake(暴力模拟)
    Codeforces--629B--Far Relative’s Problem(模拟)
    hdoj--5104--Primes Problem(素数打表)
  • 原文地址:https://www.cnblogs.com/a-du/p/7457792.html
Copyright © 2011-2022 走看看