zoukankan      html  css  js  c++  java
  • es第一篇:Getting Started

    es是一个近乎实时的搜索平台,这意味着从索引文档到文档可搜索,仅有一点点延迟(通常是1秒)。es集群是一个或多个节点的集合,它们共同保存数据,并提供跨所有节点的联合索引和搜索功能。集群名由cluster.name指定,每个节点名由node.name指定。

    通过 get /_cat 可以找出很多实用的命令,使用这些命令时在最后加上?v可以展示数据的含义,如

    get /_cat/indices?v 查看所有索引的分片数、副本数、文档数、索引大小

    get /_cat/nodes?v 查看集群所有的节点,从返回的结果中可以找出哪一个节点是master

    get /_cat/shards/{index}?v 查看某索引各分片文档数、分片大小、所在节点ip

    还有其他很多实用的命令,不再一个个列举,用的时候从里面找即可。

    Search API

    根据搜索参数放的位置不同,有两种搜索方式:一种是把参数放到request uri上,另一种是使用request body

    其中第一种比较少用,本文仅提供一个例子,不做详细介绍

    示例:

    get /bank/_doc/_search?q=*&sort=age:asc,balance:asc&from=10&size=3

    第二种方式比较常用,使用起来也比较简单,把搜索参数以json格式放到请求体中

    get /bank/_doc/_search

    {
        "query": {
            "match_all": {}
        },
        "sort": {
            "age": "asc",
            "balance": "desc"
        },
        "from": 10,
        "size": 3
    }

    from表示跳过几个文档,为0时表示一个都不跳过,从头开始取。

    如果只想返回特定的字段,比如age、balance,则命令是

    get /bank/_doc/_search
    {
        "query": {
            "match_all": {}
        },
        "_source": ["balance", "age"]
    }

    如果想取balance=49355的文档,则要用match关键字替换match_all,命令是

    get /bank/_doc/_search
    {
        "query": {
            "match": {
                "balance": "49355"
           }
        }
    }

    取address包含"mill"单词的文档,命令是

    get /bank/_doc/_search
    {
        "query": {
            "match": {
                "address": "mill"
            }
        }
    }

    实际上,结果中不仅有address包含"mill"单词的文档,还有address包含“Mill”单词的文档。这是因为es在索引文档时会把所有字母都转为小写,在搜索时也会把搜索参数中的字母转为小写,这样,即使用mill或者MILL搜索,都会返回address包含"mill"、"MILL"等凡是这四个字母组成的单词的文档。

    取address包含"mill"或"lane"的文档,命令是

    get /bank/_doc/_search
    {
        "query": {
            "match": {
                "address": "mill lane"
            }
        }
    }

    取address包含"mill lane"短语的文档,命令是:

    get /bank/_doc/_search
    {
        "query":{
            "match_phrase": {
                "address": "mill lane"
            }
        }
    }

    注意这里用了match_phrase替代之前的match,phrase的意思就是短语。

    上面命令query下面一级直接是match_all、match或match_phrase,这仅适用于单条件搜索。想要多条件搜索的话,需要用bool query,表现形式是query下面一级是bool,bool下面一级是must数组或者should数组或者must_not数组,数组里面才是多个match或者match_phrse。其中must数组是既。。又。。的意思,should数组是或。。或。。的意思,must_not数组是既不。。又不。。的意思。没有shoud_not。

    取address包含"mill"单词且age=28的文档,命令是

    get /bank/_doc/_search
    {
        "query": {
            "bool": {
                "must": [{
                    "match": {
                        "address": "mill"
                    }
                }, {
                    "match": {
                        "age": 38
                    }
                }]
            }
        }
    }

    取address包含"mill"单词或者age=28的文档,命令是

    get /bank/_doc/_search
    {
        "query": {
            "bool": {
                "should": [{
                    "match": {
                        "address": "mill"
                    }
                }, {
                    "match": {
                        "age": "28"
                    }
                }]
            }
        }
    }

    取address不包含"mill"单词且age!=28的文档,命令是

    get /bank/_doc/_search
    {
        "query": {
            "bool": {
                "must_not": [{
                    "match": {
                        "address": "mill"
                    }
                }, {
                    "match": {
                        "age": 28
                    }
                }]
            }
        }
    }

    也可以在bool中混合使用must数组、should数组、must_not数组。注意,should数组与must数组或是must_not数组一起使用的话,必须把should数组放在must数组中,即should数组是must数组的一个元素,且should数组用bool包裹。

    取age=39,且firstname是Virginia或者lastname是Ayala的文档,命令是

    get /bank/_doc/_search
    {
        "query": {
            "bool": {
                "must": [{
                    "match": {
                        "age": 39
                    }
                }, {
                    "bool": {
                        "should": [{
                            "match": {
                                "firstname": "Virginia"
                            }
                        }, {
                            "match": {
                                "lastname": "Ayala"
                            }
                        }]
                    }
                }]
            }
        }
    }

    大于、小于的筛选搜索

    bool query除了must、should、must_not外,还支持filter数组,相当于sql中的大于(等于)、小于(等于),用于数字或日期过滤。filter数组里面元素的key是range,值是个json对象,对象的key是筛选字段。

    取state=MA且余额在(8000,10000)、年龄在[20,30]的文档,命令是

    get /bank/_doc/_search
    {
        "query": {
            "bool": {
                "must": [{
                    "match": {
                        "state": "MA"
                    }
                }],
                "filter": [{
                    "range": {
                        "balance": {
                            "gt": 8000,
                            "lt": 10000
                        }
                    }
                }, {
                    "range": {
                        "age": {
                            "gte": 20,
                            "lte": 30
                        }
                    }
                }]
            }
        }
    }

    聚合

    根据state字段分组,并根据文档数量大小倒序取前10,命令是

    get /bank/_search
    {
        "size": 0,
        "aggs": {
            "group_by_state": {
                "terms": {
                    "field": "state.keyword",
                    "size": 3
                }
            }
        }
    }

  • 相关阅读:
    tensor张量
    Image Stride(内存图像行跨度)
    Batch Normalization
    论文阅读
    codeforces 520B
    codeforces 467B
    C语言位运算
    codeforces 474D
    codeforces 545c
    codeforces 698A
  • 原文地址:https://www.cnblogs.com/koushr/p/5873465.html
Copyright © 2011-2022 走看看