倒排索引原理
普通的存储方式是给每个文档编一个序号 然后让这个序号对应单个文档的所有内容 如果用这样的方式查找 当需要查找某个单词的时候需要遍历所有的文档集合
查找文档的效率会非常的慢
2.基本倒排索引:
在存储文档的时候不是以单个文档内容来做为一行存储的,而是先把所有的文档内容按照特定的分词器进行分词 以被切分后的单词做为一行来进行存储
并且在最后一列保存这个被切分后的单词出现的文档编号的集合
3.完善的倒排索引
分词原理
1.写时分词
2.读时分词
es对文本内容进行分析的三个步骤 链式调用的形式来处理
文档路由原理