zoukankan      html  css  js  c++  java
  • [ solr入门 ] Searching过程粗略梳理

    solr-searching过程分析(一)

    ——searching过程粗略梳理

    下午看了一会solr的启动过程,往细的看相当繁琐。换个头绪先看看solr的searching过程。

    1.拦截请求,解析请求并构建相应的handler。

    发送检索请求,例如:http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on

    首先他将被SolrDispatchFilter拦截。

    doFilter(ServletRequest request, ServletResponse response, FilterChain chain)
    

    通过对request的分析,获知当前request是做什么的(/select),并构造相应的handler(SearchHandler)。

    2.SolrCore出面处理上层工作(具体工作交由handler处理)

    将handler、SolrQueryRequest、SolrQueryResponse交由solrCore的execute方法处理

    public void execute(SolrRequestHandler handler, SolrQueryRequest req, SolrQueryResponse rsp)
    

    在该方法中主要还是由handler来完成的。

    SolrRequestHandler是一个接口,他主要的方法就是:

    public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp);
    

    SolrRequestHandler的实现类的结构图如下:

    其中RequestHandlerBase为大部分的Handler实现了部分功能,主要包括

    public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp){
      ......
      handleRequestBody( req, rsp );
      ......
    }

    然而具体怎么做就交给具体的子类去执行了!(handleRequestBody( req, rsp );)

    例如:这里是做检索,那么就交由SearchHandler处理。

    (这里的设计方式有点类似于servlet,GenericSerlet实现了一些公用方法,而具体的则有其子类完成,例如HttpServlet)

    3.SearchHandler具体的检索过程

    现在的检索没有使用shards,在跟踪代码的过程中,发现以下过程是检索的主要环节。

    if(!rb.isDebug()) {
            // Process
            for( SearchComponent c : components ) {
              c.process(rb);
            }
          }
    

    从中可知真正的检索需要经过多个SearchComponent,在当前的实验环境下包括6个,如下:

    4.各个SearchComponent配合工作完成检索

    我们先重点了解QueryComponent。

    获得SolrIndexSearcher,这个对象是检索的主要执行者。

    同时获取SolrIndexSearcher.QueryCommand、SolrIndexSearcher.QueryResult,并将其作为查询条件和查询结果提交给SolrIndexSearcher进行检索。

    searcher.search(result,cmd);

    在SolrIndexSearcher中search方法如下:

    public QueryResult search(QueryResult qr, QueryCommand cmd) throws IOException {
        getDocListC(qr,cmd);
        return qr;
      }
    

    getDocListC又是一个比较复杂的方法,在这里加入的cache。

    如果当前检索被缓存了(缓存也是个重点内容,后续详细分析!),那么直接返回结果,否则重新进行检索,检索的方法是:

    private void getDocListNC(QueryResult qr,QueryCommand cmd) 
    

    在该方法中,和我们使用lucene进行检索十分相似,采用的具体方法是:

    super.search(query, luceneFilter, collector);
    

    检索完成将结果进行封装,放入QueryResult当中。

    qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));
    

    检索完成后,将结果放入缓存中,“造福后人”!

    至此QueryComponent的工作就算完成了。

    如果做简单查询(如:http://localhost:8983/solr3.5/core2/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on

    那么后面5个Component就直接过了(没有真正被执行)。

    5.收尾工作

    将结果封装好,写入相应的ResponseHeaders,关闭SolrQueryRequest、solrCore。

    -----------------------------------------------------

    以上是solr-searching最粗略的过程,本着先脉络后细节的思想,以后再对各个重要环节做深入分析。

    searching主要执行方法如下:

    SolrDispatchFilter(doFilter,execute)

    ->SolrCore(execute)

    ->RequestHandlerBase(handleRequest)

    ->SearchHandler(handleRequestBody) //有可能执行多个Component

    ->QueryComponent(process)

    ->SolrIndexSearcher(search,getDocListC)

  • 相关阅读:
    面试题八 二进制中 1 的个数
    面试题七 斐波那契数列
    面试题六 用两个栈实现队列
    第 3 章 第 2 题 求级数问题 递归法实现
    第 3 章 第 1 题 精简冗余 if 语句问题 使用数组实现
    第 2 章 第 10 题 测量电灯泡体积问题
    第 2 章 第 9 题 顺序 & 二分搜索效率分析问题
    带缓冲的IO( 标准IO库 )
    Linux 中权限控制实例
    Linux 中权限的再讨论( 下 )
  • 原文地址:https://www.cnblogs.com/huangfox/p/2344686.html
Copyright © 2011-2022 走看看