zoukankan      html  css  js  c++  java
  • Elasticsearch-如何识别一篇文档

    ES-识别文档

    为了识别同一个索引中的某篇文档,ES使用_uid中的文档类型和ID结合体。_uid字段是由_id和_type字段组成,当搜索或者检索文档的时候总是能获得这两项信息。

    FengZhendeMacBook-Pro:cv FengZhen$ curl -XGET 'localhost:9200/music/album/5?pretty&fields'
    {
    "_index" : "music",
    "_type" : "album",
    "_id" : "5",
    "_version" : 1,
    "found" : true
    }

    由于所有的文档都位于同一个Lucene的索引中,ES内部使用_uid来唯一确定文档的身份。类型和ID的分离是一种抽象,通过类型的区分使得针对不同结构的运作更为容易。正是因为如此,_id通常从_uid抽取出来,但是_type必须单独索引,这样当搜索特定类型时,系统才能轻松地根据类型来过滤文档。

    _uid:
      是否存储:yes
      是否索引:yes
      描述:用于识别整个索引中的某篇文档
    _id:
      是否存储:no
      是否索引:no
      描述:该字段没有被索引,也没有被存储。如果搜索他,实际上是用的是_uid。当获得了结果,也同样是从_uid抽取内容。
    _type:
      是否存储:no
      是否索引:no_analyzed
      描述:该字段是被索引的,并且生成一个单一的词条。ES用它来过滤指定类型的文档。也可以搜索这个字段


    1. 为文档提供ID

    (1) 手动指定

    目前为止,多数是通过URI的一部分来手动提供ID。例如,为了索引ID为1st的文档,运行类似下面的命令

    FengZhendeMacBook-Pro:cv FengZhen$ curl -XPUT 'localhost:9200/get-together/manual_id/1st?pretty' -d '{
    > "name":"Elasticsearch Denver"
    > }'
    {
    "_index" : "get-together",
    "_type" : "manual_id",
    "_id" : "1st",
    "_version" : 1,
    "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
    },
    "created" : true
    }

    (2) ES自动生成

    可以依靠ES来生成唯一的ID。如果尚无唯一的ID,或者没有必要通过某种特定的属性来识别文档,这一点就很有帮助。通常而言,当索引应用程序的日志时,会这么做:这些数据没有唯一的属性来识别它们,而且它们也从不会被更新。
    为了让ES生成ID,使用HTTP POST请求并省去ID

    FengZhendeMacBook-Pro:cv FengZhen$ curl -XPOST 'localhost:9200/logs/auto_id/?pretty' -d '{
    > "message":"test es auto id"
    > }'
    {
    "_index" : "logs",
    "_type" : "auto_id",
    "_id" : "AWut3pFctSp-KrHOt_--",
    "_version" : 1,
    "_shards" : {
    "total" : 2,
    "successful" : 1,
    "failed" : 0
    },
    "created" : true
    }

    可以看到自动回复中的ID:AWut3pFctSp-KrHOt_--

    2. 在文档中存储索引名称

    除了ID和类型,为了让ES在文档中存储索引的名称,可以使用_index字段。和_id、_type一样,可以在搜索或者是GET请求的结果中看到_index,它也不是来源于字段的内容。
    ES知道每个结果来自哪个索引,所以它可以展示_index的值

    FengZhendeMacBook-Pro:cv FengZhen$ curl 'localhost:9200/_search?q=_index:get-together&pretty'

    {

      "took" : 3,

      "timed_out" : false,

      "_shards" : {

        "total" : 25,

        "successful" : 25,

        "failed" : 0

      },

      "hits" : {

        "total" : 1,

        "max_score" : 1.0,

        "hits" : [ {

          "_index" : "get-together",

          "_type" : "manual_id",

          "_id" : "1st",

          "_score" : 1.0,

          "_source" : {

            "name" : "Elasticsearch Denver"

          }

        } ]

      }

    }

  • 相关阅读:
    Map
    Enumeration输出
    iterator的基本用法
    Annotation整合工厂设计模式
    自定义Annotation
    Annotation
    动态代理设计模式
    静态代理设计模式
    自定义ClassLoader
    获取类的类对象的几种方式
  • 原文地址:https://www.cnblogs.com/EnzoDin/p/11117412.html
Copyright © 2011-2022 走看看