zoukankan      html  css  js  c++  java
  • Elasticsearch-使用映射来定义各种文档

    ES-使用映射来定义各种文档

    每篇文档属于一种类型,而每种类型属于一个索引。从数据的逻辑划分来看,可以认为索引是数据库,而类型是数据库中的表。
    类型包含了映射中每个字段的定义。映射包括了该类型的文档中可能出现的所有字段,并告诉ES如何索引一篇文档的多个字段。

    类型只提供逻辑上的分离:
    在ES中,不同类型的文档没有物理上的分离。在同一个ES索引中的所有文档,无论何种类型,都是存储在属于相同分片的同一组文件中。一份分片就是一个Lucene的索引,类型的名称是Lucene索引中一个字段。所有映射的所有字段都是Lucene索引中的字段。
    类型的概念是针对ES的一层抽象,但不属于Lucene。可以轻松地在同一个索引中拥有不同类型的文档。ES负责分离这些文档,在某个类型中搜索时,ES会过滤出属于哪个类型的文档。
    当多个类型中出现同样的字段名称时,两个同名的字段应该有同样的设置。否则,ES将很难分辨查询时指的是两个字段中的哪一个。两个字段都是属于同一个Lucene索引。


    group(分组)和event(活动)存储在不同的类型中。ES允许在一个类型、多个类型中搜索。

    1. 检索和定义映射

    1.1获取目前的映射

    为了查看某个字段类型当前的映射,向该类型URL的_mapping接口发送一个HTTP GET请求

    FengZhendeMacBook - Pro: bin FengZhen$ curl 'localhost:9200/music/singer/_mapping?pretty' {
        "music": {
            "mappings": {
                "singer": {
                    "properties": {
                        "level": {
                            "type": "string"
                        },
                        "name": {
                            "type": "string"
                        }
                    }
                }
            }
        }
    }

    新建一个专辑类型album,并索引一篇新文档

    FengZhendeMacBook - Pro: bin FengZhen$ curl - XPUT 'localhost:9200/music/album/1' - d '{
    "name": "八度空间",
    "date": "2003-10-25T19:00"
    }'

    获取当前类型映射

    FengZhendeMacBook - Pro: bin FengZhen$ curl 'localhost:9200/music/album/_mapping?pretty' {
        "music": {
            "mappings": {
                "album": {
                    "properties": {
                        "date": {
                            "type": "date",
                            "format": "strict_date_optional_time||epoch_millis"
                        },
                        "name": {
                            "type": "string"
                        }
                    }
                }
            }
        }
    }


    可看到date字段自动识别为日期类型

    1.2定义新的映射

    在索引music的album类型中,新增一个字段映射singer,类型为string

    FengZhendeMacBook - Pro: bin FengZhen$ CURL - XPUT 'localhost:9200/music/_mapping/album' - d '{
        "album": {
            "properties": {
                "singer": {
                    "type": "string"
                }
            }
        }
    }'

    查看album的映射

    FengZhendeMacBook - Pro: bin FengZhen$ curl 'localhost:9200/music/album/_mapping?pretty' {
        "music": {
            "mappings": {
                "album": {
                    "properties": {
                        "date": {
                            "type": "date",
                            "format": "strict_date_optional_time||epoch_millis"
                        },
                        "name": {
                            "type": "string"
                        },
                        "singer": {
                            "type": "string"
                        }
                    }
                }
            }
        }
    }

    2.扩展现有的映射

    如果在现有的基础上再设置一个映射,ES会将两者合并。如上述映射,包含两个来自初始映射的字段,外加定义的一个新字段。随着新字段的加入,初始的映射被扩展了,在任何时候都可以进行这样的操作,ES将次称为现有映射和先前提供的映射的合并。
    但是,并非所有的合并都是奏效的,例如:无法改变现有字段的数据类型,而且通常无法改变一个字段被索引的方式。
    试图改变singer类型为long,操作会失败并抛出异常

    FengZhendeMacBook - Pro: bin FengZhen$ CURL - XPUT 'localhost:9200/music/_mapping/album?pretty' - d '{
        "album": {
            "properties": {
                "singer": {
                    "type": "long"
                }
            }
        }
    }'
    
    {
        "error": {
            "root_cause": [{
                "type": "illegal_argument_exception",
                "reason": "mapper [singer] of different type, current_type [string], merged_type [long]"
            }],
            "type": "illegal_argument_exception",
            "reason": "mapper [singer] of different type, current_type [string], merged_type [long]"
        },
        "status": 400
    }

    避免这个错误唯一的方法是重新索引album里的所有数据,步骤如下
    (1) 将album类型里的所有数据删除。
    (2) 设置新的映射
    (3) 再次索引所有的数据 

  • 相关阅读:
    爬取 qq,酷我,千千VIP音乐下
    window10虚拟机安装
    爬取qq,酷我,千千VIP音乐 上
    BEAUTIFUL SOUP
    多线程爬取与存储基础
    CODEFORCE ROUND #625 DIV2
    【POJ
    【POJ
    【POJ
    【POJ
  • 原文地址:https://www.cnblogs.com/EnzoDin/p/11070637.html
Copyright © 2011-2022 走看看