zoukankan      html  css  js  c++  java
  • ES学习(九)

    一、倒排索引

      A、建立前会进行normalization,也就是说对各个单词进行相应的处理(时态、大小写、同义词等),以提升后面搜索时候搜到相关文档的概率

    二、分词器

      A、character filter:分词之前进行预处理,过滤html标签,&转换成and等等

      B、tokenizer:分词

      C、token filter: normalization的一些操作

    三、内置分词器(默认:standard)

      A、standard analyzer

      B、simple analyzer

      C、whitespace analyzer

      D、language analyzer

    三、query string会用跟建立倒排索引一样的分词器去分词 

    四、mapping

      A、如何建立索引

        1. analyzed:会被分词

        2. not_analyzed:不会被分词,当成exactly value

        3. no:不会被索引

      B、修改mapping

        只能创建index时手动建立mapping,或者新增field mapping,但是不能update mapping

    五、复杂数据类型

      A、multivalue field

        {"tags":["tag1","tag2"]}

      B、empty field

        null, [], [null]

      C、object field

        {}

        

  • 相关阅读:
    终于学会用WinCVS来开源了
    从网上收集EMail(正则表达式,C#源码)
    元宝NewBar发布1.2.0测试版
    使用Gimp切图
    shell编程笔记
    poj2485
    poj 3630 字典树
    杭电oj题目和分类
    强连通分量Kosaraju算法
    随机数的产生
  • 原文地址:https://www.cnblogs.com/DjanFey/p/12121010.html
Copyright © 2011-2022 走看看