zoukankan      html  css  js  c++  java
  • Lucene文件扩展名

    名称

    文件后缀

    描述

    段文件(Segments File)

    segments.gen

    segments_N

    存储提交点信息

    锁文件(Lock File)

    write.lock

    用来阻止多个indexWriter向同一个文件写数据

    段信息(Segments Info)

    .si

    存储段的元数据信息

    复合文件(Compound File)

    .cfs , .cfe

    一个可选的虚拟文件,包括所有其他索引文件系统频繁用完的文件句柄

    字段信息(Fields)

    .fnm

    存储字段的信息

    字段索引(Fields Index)

    .fdx

    包含指向字段值的指针

    字段数据(Field Data)

    .fdt

    存储文档里面的字段信息

    词典(Term Dictionary)

    .tim

    存储词信息

    词索引(Term Index)

    .tip

    指向词典的索引

    频率信息(Frequencies)

    .doc

    包含那些含有每一个词的频率的文档列表

    位置信息(Positions)

    .pos

    存储词在索引中出现的位置信息

    Payloads

    .pay

    额外存储每个位置的元数据信息,如字符偏移和用户负载

    Norms

    .nvd , .nvm

    文档和字段的length和boost系数的编码

    每个文档的值(Per-Document Values)

    .dvd , .dvm

    额外的得分系数或者每个文档的值信息编码

    词向量索引(Term Vector Index)

    .tvx

    存储文档的偏移数据文件

    词向量文件(Term Vector Documents)

    .tvd

    包含有词向量的文档信息

    词向量字段(Term Vector Fields)

    .tvf

    关于词向量的字段级信息

    删除文档(Deleted Documents)

    .del

    关于什么文件被删除的信息

  • 相关阅读:
    17.天堂和地狱只在你的一念之间
    14.事情原来可能更糟
    如何评价一个网站的人气(Link Popularity Check)
    1.人生何必一定要成功
    4.何不看开一点
    字符串到枚举的转换代码
    广州泳场一览表
    收集开源项目
    7.把“失去”当作“抛弃”
    经常使用的Oracle监控语句
  • 原文地址:https://www.cnblogs.com/chen-yu/p/3500427.html
Copyright © 2011-2022 走看看