Lucene学习总结之七：Lucene搜索过程解析(1) - 走看看

zoukankan html css js c++ java

Lucene学习总结之七：Lucene搜索过程解析(1)
一、Lucene搜索过程总论

搜索的过程总的来说就是将词典及倒排表信息从索引中读出来，根据用户输入的查询语句合并倒排表，得到结果文档集并对文档进行打分的过程。

其可用如下图示：

总共包括以下几个过程：
1. IndexReader打开索引文件，读取并打开指向索引文件的流。
2. 用户输入查询语句
3. 将查询语句转换为查询对象Query对象树
4. 构造Weight对象树，用于计算词的权重Term Weight，也即计算打分公式中与仅与搜索语句相关与文档无关的部分(红色部分)。
5. 构造Scorer对象树，用于计算打分(TermScorer.score())。
6. 在构造Scorer对象树的过程中，其叶子节点的TermScorer会将词典和倒排表从索引中读出来。
7. 构造SumScorer对象树，其是为了方便合并倒排表对Scorer对象树的从新组织，它的叶子节点仍为TermScorer，包含词典和倒排表。此步将倒排表合并后得到结果文档集，并对结果文档计算打分公式中的蓝色部分。打分公式中的求和符合，并非简单的相加，而是根据子查询倒排表的合并方式(与或非)来对子查询的打分求和，计算出父查询的打分。
8. 将收集的结果集合及打分返回给用户。
查看全文

相关阅读:
beta冲刺总结-咸鱼
 咸鱼翻身beta冲刺博客集
 事后诸葛亮
 个人作业——软件产品案例分析
 Alpha冲刺博客集
 结对作业第二次
 项目需求分析（团队）
第二次作业——个人项目实战
 软件工程实践第一次作业--准备
 beta冲刺总结

原文地址：https://www.cnblogs.com/forfuture1978/p/1704242.html

Copyright © 2011-2022 走看看