名称 |
文件后缀 |
描述 |
段文件(Segments File) |
segments.gen segments_N |
存储提交点信息 |
锁文件(Lock File) |
write.lock |
用来阻止多个indexWriter向同一个文件写数据 |
段信息(Segments Info) |
.si |
存储段的元数据信息 |
复合文件(Compound File) |
.cfs , .cfe |
一个可选的虚拟文件,包括所有其他索引文件系统频繁用完的文件句柄 |
字段信息(Fields) |
.fnm |
存储字段的信息 |
字段索引(Fields Index) |
.fdx |
包含指向字段值的指针 |
字段数据(Field Data) |
.fdt |
存储文档里面的字段信息 |
词典(Term Dictionary) |
.tim |
存储词信息 |
词索引(Term Index) |
.tip |
指向词典的索引 |
频率信息(Frequencies) |
.doc |
包含那些含有每一个词的频率的文档列表 |
位置信息(Positions) |
.pos |
存储词在索引中出现的位置信息 |
Payloads |
.pay |
额外存储每个位置的元数据信息,如字符偏移和用户负载 |
Norms |
.nvd , .nvm |
文档和字段的length和boost系数的编码 |
每个文档的值(Per-Document Values) |
.dvd , .dvm |
额外的得分系数或者每个文档的值信息编码 |
词向量索引(Term Vector Index) |
.tvx |
存储文档的偏移数据文件 |
词向量文件(Term Vector Documents) |
.tvd |
包含有词向量的文档信息 |
词向量字段(Term Vector Fields) |
.tvf |
关于词向量的字段级信息 |
删除文档(Deleted Documents) |
.del |
关于什么文件被删除的信息 |