[ solr入门 ] Searching过程粗略梳理

zoukankan html css js c++ java

[ solr入门 ] Searching过程粗略梳理
solr-searching过程分析（一）

——searching过程粗略梳理

下午看了一会solr的启动过程，往细的看相当繁琐。换个头绪先看看solr的searching过程。

1.拦截请求，解析请求并构建相应的handler。

发送检索请求，例如：http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on

首先他将被SolrDispatchFilter拦截。
doFilter(ServletRequest request, ServletResponse response, FilterChain chain)
通过对request的分析，获知当前request是做什么的（/select），并构造相应的handler（SearchHandler）。

2.SolrCore出面处理上层工作（具体工作交由handler处理）

将handler、SolrQueryRequest、SolrQueryResponse交由solrCore的execute方法处理
public void execute(SolrRequestHandler handler, SolrQueryRequest req, SolrQueryResponse rsp)
在该方法中主要还是由handler来完成的。

SolrRequestHandler是一个接口，他主要的方法就是：
public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp);
SolrRequestHandler的实现类的结构图如下：

其中RequestHandlerBase为大部分的Handler实现了部分功能，主要包括
public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp){ 　　...... 　　handleRequestBody( req, rsp ); 　　...... }
然而具体怎么做就交给具体的子类去执行了！（handleRequestBody( req, rsp );）

例如：这里是做检索，那么就交由SearchHandler处理。

（这里的设计方式有点类似于servlet，GenericSerlet实现了一些公用方法，而具体的则有其子类完成，例如HttpServlet）

3.SearchHandler具体的检索过程

现在的检索没有使用shards，在跟踪代码的过程中，发现以下过程是检索的主要环节。
if(!rb.isDebug()) { // Process for( SearchComponent c : components ) { c.process(rb); } }
从中可知真正的检索需要经过多个SearchComponent，在当前的实验环境下包括6个，如下：

4.各个SearchComponent配合工作完成检索

我们先重点了解QueryComponent。

获得SolrIndexSearcher，这个对象是检索的主要执行者。

同时获取SolrIndexSearcher.QueryCommand、SolrIndexSearcher.QueryResult，并将其作为查询条件和查询结果提交给SolrIndexSearcher进行检索。
searcher.search(result,cmd);
在SolrIndexSearcher中search方法如下：
public QueryResult search(QueryResult qr, QueryCommand cmd) throws IOException { getDocListC(qr,cmd); return qr; }
getDocListC又是一个比较复杂的方法，在这里加入的cache。

如果当前检索被缓存了（缓存也是个重点内容，后续详细分析！），那么直接返回结果，否则重新进行检索，检索的方法是：
private void getDocListNC(QueryResult qr,QueryCommand cmd)
在该方法中，和我们使用lucene进行检索十分相似，采用的具体方法是：
super.search(query, luceneFilter, collector);
检索完成将结果进行封装，放入QueryResult当中。
qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));
检索完成后，将结果放入缓存中，“造福后人”！

至此QueryComponent的工作就算完成了。

如果做简单查询（如：http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on）

那么后面5个Component就直接过了（没有真正被执行）。

5.收尾工作

将结果封装好，写入相应的ResponseHeaders，关闭SolrQueryRequest、solrCore。

-----------------------------------------------------

以上是solr-searching最粗略的过程，本着先脉络后细节的思想，以后再对各个重要环节做深入分析。

searching主要执行方法如下：

SolrDispatchFilter（doFilter,execute）

->SolrCore(execute)

->RequestHandlerBase(handleRequest)

->SearchHandler(handleRequestBody) //有可能执行多个Component

->QueryComponent(process)

->SolrIndexSearcher(search,getDocListC)
查看全文

相关阅读:
lostash 正则
 Mysql 利用multiline 实现多行匹配
 java中byte, int的转换
 mysql perl 抓取update语句
 $/ 改变换行符
 mysql 匹配update
perl binlog dml操作报告
 mysql 分区按 PARTITION BY RANGE (TO_DAYS(startTime))
Mysql explain 查看分区表
 写作的力道——北漂18年（番外篇一）

原文地址：https://www.cnblogs.com/huangfox/p/2344686.html