zoukankan      html  css  js  c++  java
  • 在Ubuntu下安装Solr

      使用wget命令去官网下载solr的压缩包。

    1 wget https://mirrors.bfsu.edu.cn/apache/lucene/solr/8.6.3/solr-8.6.3.tgz

      使用tar命令解压后,在solr的主目录 solr-8.6.3/ 下的 bin 目录下执行  ./solr start ,也可以查看solr的其他命令,指定端口启动。

       会发现出现两个警告,暂时先不管,这两个警告是在说当前的文件读写数限制在1024,建议把这个值改成65000,另一个是当前的最大进程数是14885,建议也把它设置成65000。这些可以去找相关的Linux的配置文件来修改。

      然后访问solr的界面(此处略过了一些因为防火墙导致无法访问的问题),如下:

       还可以使用solr的一些命令,:

    1. -c <name> -要创建的核心或集合的名称(必需)。
    2. -d <confdir> -配置目录,在SolrCloud模式非常有用。
    3. -n <configName> -配置名称。这将默认为核心或集合的名称。
    4. -p <port> -本地Solr的实例的端口发送create命令; 默认脚本试图通过寻找运行Solr的实例来检测端口。
    5. -s <shards> -将集合拆分为的分片数,默认为 1.
    6. -rf <replicas> -集合中的每个文件的份数。默认值是1。

      接下来创建一个核心 core1:

    1 solr-8.6.3/bin/solr create -c core1 

      可以看见创建核心 core1 成功了,但出现了一个警告,是说创建核心的时候没有指定configset,默认会使用_default_configset里面的配置,这种方式不适合生产环境下使用。

      刷新下浏览器,发现可以选择核心core1。

      这个核心/集合下有很多核心专用的工具:

    • Ping - 让你 ping 一个已命名的核心,并确定核心是否处于活动状态。

    • 插件/统计(Plugins/Stats) - 显示插件和其他已安装组件的统计信息。

    • 复制(Replication) - 显示核心的当前复制状态,并允许你启用/禁用复制。

    • 段信息(Segments Info) - 提供底层 Lucene 索引段的可视化。

    如果你正在运行 Solr 的单个节点实例,则通常在每个集合基础上显示的其他 UI 界面也将被列出:

    • 分析(Analysis) - 让你分析在特定字段中找到的数据。

    • 导入(Dataimport) - 显示有关数据导入处理程序的当前状态的信息。

    • 文档(Documents) - 提供了一个简单的表单,允许你直接从浏览器执行各种 Solr 索引命令。

    • 文件(Files) - 显示当前的核心配置文件,如:solrconfig.xml。

    • 查询(Query) - 让你提交关于核心的各种元素的结构化查询。

    • 流(Stream) - 允许你提交流表达式并查看结果和解析解释。

    • 模式浏览器(Schema Browser) - 在浏览器窗口中显示架构数据。

      下面介绍下分析器,根据模式中的字段、字段类型和动态字段配置来检查数据的处理方式。您可以分析在索引期间或在查询处理过程中如何处理内容,以及如何单独或同时查看结果。把鼠标放在输出内容左边那个"ST"上会显示它的全称,StandardTokenizer标准分词器,下面的“SF”,StopFilter停用词过滤器等。

      文档界面提供了一个简单的表单,允许你直接从浏览器以各种格式执行各种 Solr 索引命令,定义要添加或删除的文档,只更新文档的某些字段,或提交和优化索引上的命令。比如说下面的添加/更新文档。

     

       使用查询界面将搜索查询提交给 Solr 集合并分析结果,下面简单的直接点击执行查询。

      查询命令的一些基本使用:

      q:查询指定关键字,这个很重要,例如:q=id:1,默认q=*:*;

      fq(filter query):过滤查询,提供一个可选的筛选器查询。返回q查询出来的结果中符合fq条件的查询结果;

      sort:排序方式,例如:id desc,按照id降序;

      start、rows:返回结果的第几条记录开始,分页用途,默认0开始;指定返回结果最多有多少条记录,默认为10,配合start实现分页;

      fl:指定返回哪些字段,使用逗号或空格分隔,注意:字段区分大小写,例如:fl=id,title;

      df:默认的查询字段,一般默认指定;

      qt(query type):指定一个类型来处理查询请求,默认是standard;

      wt(write type):指定输出格式,有xml、json等;

      indent:是否使用缩进;

      version:查询语法的版本,建议不使用,默认;

      debugQuery:返回的结果会包含调试信息;

      dismax:旨在处理用户输入的简单短语(无复杂语法),并根据每个字段的重要性使用不同的权重(提升)在多个字段中搜索单个术语。附加选项使用户可以根据每个用例的特定规则(独立于用户输入)来影响得分;

      edismax:是dismax查询解析器的改进版本;

      hl:高亮;

      facet:分面,根据索引词将搜索结果按类别进行排列。

      详细的可以去Solr官网看看参考指南

     
  • 相关阅读:
    PHP常用时间函数总结
    LNMP 1.2缓存加速类扩展(xcache/Redis/memcached/eAccelerator)、imageMagick、ionCube安装教程
    LNMP强制https访问
    查看lnmp的编译参数和版本
    LNMP 1.2/1.3+升级Nginx、MySQL/MariaDB、PHP教程
    微信小程序websocket多页面冲突解决办法
    lnmp “.user.ini”无法删除解决方法
    一些js函数
    vue下拉框三级联动
    mysql取某个字段中的内容有等于数组中某个元素的数据
  • 原文地址:https://www.cnblogs.com/magic-sea/p/13912426.html
Copyright © 2011-2022 走看看