zoukankan      html  css  js  c++  java
  • Solr记录-solr基础内容

    Solr架构(体系结构)

    在本章中,我们将讨论Apache Solr的架构。 下图显示了Apache Solr的体系结构的框图。

    Solr架构 - 构件块
    以下是Apache Solr的主要构建块(组件)

      • 请求处理程序 - 发送到Apache Solr的请求由这些请求处理程序处理。请求可以是查询请求或索引更新请求。根据这些请示的要求来选择请求处理程序。为了将请求传递给Solr,通常将处理器映射到某个URI端点,并且它将为指定的请求提供服务。
      • 搜索组件 - 搜索组件是Apache Solr中提供的搜索类型(功能)。它可能是拼写检查,查询,构面,命中突出显示等。这些搜索组件被注册为搜索处理程序。多个组件可以注册到搜索处理程序。
      • 查询解析器 − Apache Solr查询解析器解析传递给Solr的查询,并验证查询的语法是否有错误。解析查询后,将它们转换为Lucene理解的格式。
      • 响应写入器 - Apache Solr中的响应写入器是为用户查询生成格式化输出的组件。 Solr支持XML,JSON,CSV等响应格式。对每种类型的响应都有不同的响应写入。
      • 分析器/分词器 - Lucene以令牌的形式识别数据。 Apache Solr分析内容,将其分成令牌,并将这些令牌传递给Lucene。 Apache Solr中的分析器检查字段的文本并生成令牌流。分词器将分析器准备的令牌流分解成令牌。
      • 更新请求处理器 - 每当向Apache Solr发送更新请求时,请求都通过一组称为更新请求处理器的插件(签名,日志记录,索引)运行。这个处理器负责修改,例如删除字段,添加字段等。

    Solr术语

    在本章中,我们将解释并理解在Solr中经常使用的一些术语的真正含义。

    一般术语

    以下是在所有类型的Solr设置中使用的一般术语的列表 -

    实例 - 就像一个tomcat实例或一个jetty实例,这个术语指的是在JVM中运行的应用程序服务器。Solr主目录提供对每个这些Solr实例的引用,一个或多个核心可以配置在每个实例中运行。

    • 核心(core) - 在应用程序中运行多个索引时,可以在每个实例中拥有多个核心,而不是每个核心的多个实例。

    • 主目录(home) - 术语$SOLR_HOME是指主目录,其中包含有关内核及其索引,配置和依赖关系的所有信息。

    • 碎片(Shard) - 在分布式环境中,数据在多个Solr实例之间进行分区,其中每个数据块可以称为碎片(Shard)。它包含整个索引的子集。

    SolrCloud术语

    在前面的章节中,我们讨论了如何在独立模式下安装Apache Solr。请注意,还可以在分布式模式(云环境)中安装SolrSolr以主从模式安装。在分布式模式下,索引在主服务器上创建,并且将其复制到一个或多个从服务器。

    Solr Cloud相关的主要术语如下 -

    • 节点(Node) - 在Solr云中,Solr的每个单个实例都被视为一个节点。
    • 集群 - Solr云环境中的所有节点组合在一起构成集群。
    • 集合 - 集群具有称为集合的逻辑索引。
    • 碎片 - 碎片是集合的一部分,它具有一个或多个索引副本。
    • 副本 - 在Solr Core中,在节点中运行的分片副本称为副本。
    • 领导者(Leader) - 它也是碎片的副本,它将Solr Cloud的请求分发给剩余的副本。
    • Zookeeper - 这是一个Apache项目,Solr Cloud用于集中配置和协调,管理集群和选择领导者。

    配置文件

    Apache Solr中的主要配置文件如下 -

    • Solr.xml - 它是包含Solr Cloud相关信息,此文件是在$SOLR_HOME目录中。 为了加载核心,Solr引用这个文件,这有助于识别它们。
    • Solrconfig.xml − 此文件包含与请求处理和响应格式化相关的定义,核心特定配置,以及索引,配置,管理内存和提交。
    • Schema.xml − 此文件包含整个模式以及字段和字段类型。
    • Core.properties - 此文件包含特定于核心的配置。它被引用为核心发现,因为它包含核心的名称和数据目录的路径。它可以在任何目录中使用,会将此目录它视为核心目录。

    启动Solr

    安装Solr后,进入到Solr主目录中的bin文件夹,并使用以下命令启动Solr。

    [Hadoop@localhost ~]$ cd   
    [Hadoop@localhost ~]$ cd Solr/ 
    [Hadoop@localhost Solr]$ cd bin/ 
    [Hadoop@localhost bin]$ ./Solr start
    
    Shell

    在 Windows 系统中使用以下命令 -

    此命令在后台启动Solr,通过显示以下消息监听端口8983

    Waiting up to 30 seconds to see Solr running on port 8983 []   
    Started Solr server on port 8983 (pid = 6035). Happy searching!
    
    Bash

    在前台启动Solr

    如果使用start命令启动Solr,那么Solr将在后台启动。然而可以使用-f选项在前台启动Solr。

    [Hadoop@localhost bin]$ ./Solr start –f  
    
    5823 INFO  (coreLoadExecutor-6-thread-2) [   ] o.a.s.c.SolrResourceLoader 
    Adding 'file:/home/Hadoop/Solr/contrib/extraction/lib/xmlbeans-2.6.0.jar' to 
    classloader 
    5823 INFO  (coreLoadExecutor-6-thread-2) [   ] o.a.s.c.SolrResourceLoader 
    Adding 'file:/home/Hadoop/Solr/dist/Solr-cell-6.2.0.jar' to classloader 
    5823 INFO  (coreLoadExecutor-6-thread-2) [   ] o.a.s.c.SolrResourceLoader 
    Adding 'file:/home/Hadoop/Solr/contrib/clustering/lib/carrot2-guava-18.0.jar' 
    to classloader 
    5823 INFO  (coreLoadExecutor-6-thread-2) [   ] o.a.s.c.SolrResourceLoader 
    Adding 'file:/home/Hadoop/Solr/contrib/clustering/lib/attributes-binder1.3.1.jar' 
    to classloader 
    5823 INFO  (coreLoadExecutor-6-thread-2) [   ] o.a.s.c.SolrResourceLoader 
    Adding 'file:/home/Hadoop/Solr/contrib/clustering/lib/simple-xml-2.7.1.jar' 
    to classloader 
    …………………………………………………………………………………………………………………………………………………………………………………………………………… 
    …………………………………………………………………………………………………………………………………………………………………………………………………. 
    12901 INFO  (coreLoadExecutor-6-thread-1) [   x:Solr_sample] o.a.s.u.UpdateLog 
    Took 24.0ms to seed version buckets with highest version 1546058939881226240 12902 
    INFO  (coreLoadExecutor-6-thread-1) [   x:Solr_sample] 
    o.a.s.c.CoreContainer registering core: Solr_sample 
    12904 INFO  (coreLoadExecutor-6-thread-2) [   x:my_core] o.a.s.u.UpdateLog Took 
    16.0ms to seed version buckets with highest version 1546058939894857728 
    12904 INFO  (coreLoadExecutor-6-thread-2) [   x:my_core] o.a.s.c.CoreContainer 
    registering core: my_core
    
    Shell

    在另一个端口上启动Solr

    使用start命令的-p选项指定一个启动端口,可以在另一个端口启动Solr,如下面的代码块所示。

    [Hadoop@localhost bin]$ ./Solr start -p 8081  
    
    Waiting up to 30 seconds to see Solr running on port 8081 [-]   
    Started Solr server on port 8081 (pid = 10137). Happy searching!
    
    Shell

    停止Solr

    可以使用stop命令停止Solr,如下示例 -

    $ ./Solr stop
    
    Shell

    此命令停止Solr,显示消息如下所示。

    Sending stop command to Solr running on port 8983 ... waiting 5 seconds to 
    allow Jetty process 6035 to stop gracefully.
    
    Shell

    重新启动Solr

    Solr的 restart 命令会停止Solr 5秒钟,然后再次启动。可以使用以下命令重新启动Solr -

    ./Solr restart
    
    Shell

    此命令重新启动Solr,显示以下消息 -

    Sending stop command to Solr running on port 8983 ... waiting 5 seconds to 
    allow Jetty process 6671 to stop gracefully. 
    Waiting up to 30 seconds to see Solr running on port 8983 [|]  [/]   
    Started Solr server on port 8983 (pid = 6906). Happy searching!
    
    Shell

    Solr ─ help 命令

    Solr的help命令可用于查看Solr提示及其选项的用法。

    [Hadoop@localhost bin]$ ./Solr -help  
    
    Usage: Solr COMMAND OPTIONS        
       where COMMAND is one of: start, stop, restart, status, healthcheck, 
    create, create_core, create_collection, delete, version, zk  
    Standalone server example (start Solr running in the background on port 8984):  
       ./Solr start -p 8984  
    SolrCloud example (start Solr running in SolrCloud mode using localhost:2181 
    to connect to Zookeeper, with 1g max heap size and remote Java debug options enabled):  
       ./Solr start -c -m 1g -z localhost:2181 -a "-Xdebug -
       Xrunjdwp:transport = dt_socket,server = y,suspend = n,address = 1044"  
    Pass -help after any COMMAND to see command-specific usage information,   
    such as: ./Solr start -help or ./Solr stop -help
    
    Shell

    Solr ─ status命令

    Solr的 status 命令可用于在计算机上搜索和找出运行的Solr实例。它可以提供有关Solr实例的信息,例如它的版本,内存使用情况等。

    可以使用status命令检查Solr实例的状态,如下所示:

    [Hadoop@localhost bin]$ ./Solr status
    
    Shell

    执行时,显示上述Solr的status命令结果如下 -

    Found 1 Solr nodes:   
    
    Solr process 6906 running on port 8983 {   
       "Solr_home":"/home/Hadoop/Solr/server/Solr",   
       "version":"6.2.0 764d0f19151dbff6f5fcd9fc4b2682cf934590c5 - 
       mike - 2016-08-20 05:41:37",   
       "startTime":"2016-09-20T06:00:02.877Z",   
       "uptime":"0 days, 0 hours, 5 minutes, 14 seconds",   
       "memory":"30.6 MB (%6.2) of 490.7 MB"
    }
    
    Shell

    Solr Admin

    启动Apache Solr后,就可以使用以下URL访问Solr Web界面的主页。

    Solr管理员的界面如下 -

  • 相关阅读:
    linux服务器上无root权限如何安装nodejs?
    Jupyter按tab键无法补全,而且报错TypeError: __init__() got an unexpected keyword argument 'column'的解决办法
    通过损失函数优化提高训练速度、准确性和数据利用率
    华为诺亚AutoML框架-Vega:(2) 代码结构
    华为诺亚实验室AutoML框架-Vega:(1) 介绍
    AutoML: A survey of the state-of-the-art综述期刊论文免费下载
    安装Docker 图形界面管理工具 -- Portainer
    Dockfile 编写示例(将 jar 制作成容器)
    Docker 常用命令集
    云服务器CentOS安装Docker
  • 原文地址:https://www.cnblogs.com/xinfang520/p/7722270.html
Copyright © 2011-2022 走看看