zoukankan      html  css  js  c++  java
  • Elasticsearch的倒排索引

    正排索引和倒排索引

     倒排索引核心组成

    单词词典(TermDictionary) 记录所有文档的单词,记录单词到倒排列表的关联关系

      单词词典一般比较大,可以通过B+树或者哈希拉链法去实现,以满足高性能的插入与查询

    倒排列表(Posting List)-记录单词对应的文档结合,由倒排索引项组成

      倒排索引项

        文档ID

        词频TF - 该单词在文档中出现的次数,用于相关性评分

        位置 - 单词在文档中分词的位置,用于语句搜索

        偏移 - 记录单词的开始结束位置,实现高亮显示

    Elasticsearch的倒排索引

  • 相关阅读:
    算法笔记--二分图判定
    算法笔记--最小表示法
    Codeforces 525A
    Codeforces 140D
    Codeforces C
    Codeforces 665C
    Codeforces 604B
    Codeforces 285C
    The Fewest Coins POJ
    Triangular Pastures POJ
  • 原文地址:https://www.cnblogs.com/fat-girl-spring/p/12786492.html
Copyright © 2011-2022 走看看