一、倒排索引
A、建立前会进行normalization,也就是说对各个单词进行相应的处理(时态、大小写、同义词等),以提升后面搜索时候搜到相关文档的概率
二、分词器
A、character filter:分词之前进行预处理,过滤html标签,&转换成and等等
B、tokenizer:分词
C、token filter: normalization的一些操作
三、内置分词器(默认:standard)
A、standard analyzer
B、simple analyzer
C、whitespace analyzer
D、language analyzer
三、query string会用跟建立倒排索引一样的分词器去分词
四、mapping
A、如何建立索引
1. analyzed:会被分词
2. not_analyzed:不会被分词,当成exactly value
3. no:不会被索引
B、修改mapping
只能创建index时手动建立mapping,或者新增field mapping,但是不能update mapping
五、复杂数据类型
A、multivalue field
{"tags":["tag1","tag2"]}
B、empty field
null, [], [null]
C、object field
{}