zoukankan      html  css  js  c++  java
  • 67.倒排索引结构理解

    倒排索引,是适合用于进行搜索的,倒排索引的结构是比较复杂的,总体来说包括以下几个部分

    1)包含这个关键词的document list

    2)包含这个关键词的所有document的数量:IDFinverse document frequency

    3)这个关键词在每个document中出现的次数:TFterm frequency

    4)这个关键词在这个document中的次序

    5)每个document的长度:length norm

    6)包含这个关键词的所有document的平均长度

       

    倒排索引是不可变的,不可变的好处有:

    1)不需要锁,提升并发能力,避免锁的问题

    2)数据不变,只要cache内存足够就可以一直保存在os cache中,

    3)因为数据不变,filter cache可以一直驻留在内存中,提升性能

    4)可以压缩,节省cpuio开销

       

    倒排索引不可变的坏处:每次都要重新构建整个索引

  • 相关阅读:
    yanghui杨辉三角--(一维数组
    yanghui杨辉三角--(一维数组)探索1 2
    yanghui杨辉三角--(二维数组
    Fiber VS Coroutine VS Green Thread
    Java8-Reference
    Boolean
    Java-相等
    java.lang.Cloneable
    java.lang.CharSequence
    java.lang.AutoCloseable
  • 原文地址:https://www.cnblogs.com/liuqianli/p/8476903.html
Copyright © 2011-2022 走看看