zoukankan      html  css  js  c++  java
  • CentOS7.5 Linux搭建全文检索--Solr7.4.0单机服务

    一.Solr安装环境

    1.官方参考文档

    Solr教程参考指南:http://lucene.apache.org/solr/guide/7_4/solr-tutorial.html

    2.Solr运行环境

    系统要求:Java 8+      这里我们把solr服务部署到Tomacat服务器中,Tomcat安装过程参考:https://www.cnblogs.com/frankdeng/p/9597699.html

    在solr5以前solr的启动都有tomcat作为容器,但是从solr5以后solr内部集成jetty服务器,可以通过bin目录中脚本直接启动。就是从solr5以后跟solr4最大的区别是被发布成一个独立的应用。

    3.Solr下载

     下载地址:http://archive.apache.org/dist/lucene/solr/

    [admin@node21 software]$ wget http://archive.apache.org/dist/lucene/solr/7.4.0/solr-7.4.0.tgz
    [admin@node21 software]$ ll
    -rw-rw-r-- 1 admin admin 167346886 Jun 19 02:51 solr-7.4.0.tgz

    二.Solr单机安装

    1. 解压安装包

    [admin@node21 software]$ tar zxvf solr-7.4.0.tgz 
    [admin@node21 software]$ ls solr-7.4.0
    bin CHANGES.txt contrib dist docs example licenses LICENSE.txt LUCENE_CHANGES.txt NOTICE.txt README.txt server

    2.部署solr到tomcat下

    注意,这里因为我用的是solr7.4最新版,所以跟solr4版本要拷贝*.war文件,然后再启动tomcat解压的操作是不一样的 ,

    1)复制并重命名solr目录里的server/solr-webapp/webapp文件夹到/usr/local/tomcat8/webapps/solr

    [admin@node21 software]$ sudo cp -r solr-7.4.0/server/solr-webapp/webapp /usr/local/tomcat8/webapps/solr

    2)拷贝solr-7.4.0serverlibext 下的jar包以及lib目录下gmetric4j-1.0.7.jar和metrics开头的jar包拷贝到 tomcat8webappssolr 项目的WEB-INFlib下

    [admin@node21 software]$ sudo cp solr-7.4.0/server/lib/ext/* /usr/local/tomcat8/webapps/solr/WEB-INF/lib/
    [admin@node21 software]$ sudo cp solr-7.4.0/server/lib/gmetric4j-1.0.7.jar /usr/local/tomcat8/webapps/solr/WEB-INF/lib/
    [admin@node21 software]$ sudo cp solr-7.4.0/server/lib/metrics-*  /usr/local/tomcat8/webapps/solr/WEB-INF/lib/

    3)创建一个索引库solrhome

    拷贝solr-7.4.0server 下的solr文件夹到其它非中文目录下,重命名为solrhome,我是建立到了/usr/local/tomcat8/solrhome下

    [admin@node21 software]$ sudo cp -r solr-7.4.0/server/solr /usr/local/tomcat8/solrhome

    4)关联solr及索引库solrhome,需要修改tomcat里solr工程的web.xml文件

    [admin@node21 software]$ sudo vi /usr/local/tomcat8/webapps/solr/WEB-INF/web.xml 

    找到如下代码,打开注释,修改自己的solrhome的路径/put/your/solr/home/here,我的是 /usr/local/tomcat8/solrhome 路径。

    复制代码
    40   <!--
    41     <env-entry>
    42        <env-entry-name>solr/home</env-entry-name>
    43        <env-entry-value>/put/your/solr/home/here</env-entry-value>
    44        <env-entry-type>java.lang.String</env-entry-type>
    45     </env-entry>
    46    -->
    复制代码

    如下图:

    然后到最下方,将这一段注释掉,不然会报403错误,完成后保存退出(solr4部署不用注释这个)

    5)拷贝solr7.4.0server esources下的 log4j2.xml 到tomcat8/webapps/solr/WEB-INFclasses,如果WEB-INF下没有classes文件那么就创建一个classes文件夹 

    [admin@node21 tomcat8]$ sudo mkdir -p /usr/local/tomcat8/webapps/solr/WEB-INF/classes/
    [admin@node21 tomcat8]$ sudo cp -r /opt/software/solr-7.4.0/server/resources/log4j2.xml /usr/local/tomcat8/webapps/solr/WEB-INF/classes/

    6)修改tomcat的bin目录下catalina.bat脚本,增加solr.log.dir系统变量,指定solr日志记录存放地址。

    [root@node21 solr]# vi /usr/local/tomcat8/bin/catalina.sh 
    JAVA_OPTS="$JAVA_OPTS -Dsolr.log.dir=/usr/local/tomcat8/solrhome/logs"

    3.启动服务 

    启动tomcat,访问需要完整路径,我的是http://node21:8080/solr/index.html

    4.配置solr的索引库core

    1)点击Core Admin,接着点击Add Core这项,创建的instanceDir和dataDir 需存在,报错如下。(Solr里面的core就像数据库里面的一个表,用来管理索引和相关配置。)

    2)在索引库目录solrhome下创建new_core目录,拷贝配置文件到new_core目录下

    [admin@node21 tomcat8]$ su root
    [root@node21 tomcat8]$  mkdir /usr/local/tomcat8/solrhome/new_core 
    [root@node21 solrhome]$ cp -r /usr/local/tomcat8/solrhome/configsets/sample_techproducts_configs/conf  /usr/local/tomcat8/solrhome/new_core/

    然后重启tomcat服务,重新创建core成功

    5.配置IK中文分词器

    项目地址:https://github.com/magese/ik-analyzer-solr7

    内置的分词器不支持停用,扩展功能,ik中文分词器支持屏蔽关键词、新词汇的配置。下载地址:https://pan.baidu.com/s/1vxs98d440NSQIqjc50w1Rw,密码:9dbe

    解压分词器安装包

    [root@node21 software]# unzip ikanalyzer-solr6.5.zip  
    [root@node21 software]# lsikanalyzer-solr5 ikanalyzer-solr6.5.zip
    [root@node21 software]# ls ikanalyzer-solr5/
    ext.dic  IKAnalyzer.cfg.xml  ik-analyzer-solr5-5.x.jar  solr-analyzer-ik-5.1.0.jar  stopword.dic

    1)将IK分词器 JAR 包拷贝到Tomcat8webappssolrWEB-INFlib下

    [root@node21 ikanalyzer-solr5]# cp ik-analyzer-solr5-5.x.jar solr-analyzer-ik-5.1.0.jar /usr/local/tomcat8/webapps/solr/WEB-INF/lib/

    2)将词典 配置文件拷贝到 Tomcat8webappssolrWEB-INFclasses下

    [root@node21 ikanalyzer-solr5]# cp ext.dic IKAnalyzer.cfg.xml stopword.dic /usr/local/tomcat8/webapps/solr/WEB-INF/classes/

    3)更改在Tomcat8solr_hsolrhome ew_coreconf找到managed-schema配置文件,末尾添加以下保存

    复制代码
    [root@node21 ikanalyzer-solr5]# vi /usr/local/tomcat8/solrhome/new_core/conf/managed-schema 
    <!--IK中文分词器-->
     <fieldType name="text_ik" class="solr.TextField">  
            <analyzer type="index" useSmart="false"
                class="org.wltea.analyzer.lucene.IKAnalyzer" />
            <analyzer type="query" useSmart="true"
                class="org.wltea.analyzer.lucene.IKAnalyzer" />
    </fieldType> 
    复制代码

    4)重启tomcat服务,测试

    6. 停止服务

    如果要关闭solr服务,直接关闭tomcat就可以了。

    三.Solr集群版

    solr集群搭建参考:https://www.cnblogs.com/frankdeng/p/9597680.html#top 

    四.配置Solr服务器导入数据库数据

    步骤:

    (1)导包

    首先是需要在solr的核心库中添加一些导入数据的包,需要如下:

     

    注意:因为在collection中,最初是没有lib这个文件目录的,所以需要自己创建一个lib目录,然后把相应的jar包添加进去。

    (2)在collection中的config目录下的solrconfig.xml中添加数据导入处理器

    1 <requestHandler name="/dataimport" 
    2 class="org.apache.solr.handler.dataimport.DataImportHandler">
    3 <lst name="defaults">
    4 <str name="config">data-config.xml</str>
    5 </lst>
    6 </requestHandler>

    (3)在collection中的config目录添加一个data-config.xml(这个与上面一步配置的名字要相同)

     1 <?xml version="1.0" encoding="UTF-8" ?>
     2 <dataConfig>
     3 <dataSource type="JdbcDataSource"
     4 driver="com.mysql.jdbc.Driver"
     5 url="jdbc:mysql://localhost:3306/需要导入数据的数据库名"
     6 user="数据库账号"
     7 password="数据库密码"/>
     8 <document>
     9 <entity name="product" query="SELECT pid,name,catalog_name,price,description,picture FROM products">
    10 <field column="pid" name="id" />
    11 <field column="name" name="product_name" />
    12 <field column="catalog_name" name="product_catalog_name" />
    13 <field column="price" name="product_price" />
    14 <field column="description" name="product_description" />
    15 <field column="picture" name="product_picture" />
    16 </entity>
    17 </document>
    18 </dataConfig>

    备注:上面的内容,其实一看就大体明白了什么意思,主要就是配置要导入哪个数据库,导入的字段有什么,如果不配置的话,那么solr服务器是无法判断得到的字段的,所以需要进行配置,相当于一个映射配置。

    注意:我上面的entity里面的内容就是我需要导入数据的字段的些内容,所以,根据需求进行自行匹配。

    (4)在collection中config目录下的schema.xml添加如下内容:(这个是为了能够便于对导入数据库中的数据,与solr中的域进行匹配,因为我们都知道,如果solr域中不存在相应的域,那么是无法进行查询修改删除操作的,那么就不利于我们在以后的项目中对数据库相应字段的处理,所以,这一步是可有可无,但是配置了就有很多的好处)

    1 <!--配置从数据库导入到sorl中的数据的字段内容,所以每次要从数据库导入什么就需要配置什么-->
    2 <field name="product_name" type="text_ik" indexed="true" stored="true"/>
    3 <field name="product_price" type="float" indexed="true" stored="true"/>
    4 <field name="product_description" type="text_ik" indexed="true" stored="false"/>
    5 <field name="product_picture" type="string" indexed="false" stored="true"/>
    6 <field name="product_catalog_name" type="string" indexed="true" stored="true"/>
    7 <field name="product_keywords" type="text_ik" indexed="true" stored="false" multiValued="true" />
    8 <copyField source="product_name" dest="product_keywords" />
    9 <copyField source="product_description" dest="product_keywords" />

    (5)重启tomcat,然后登陆solr服务

    (6)进行添加数据的处理

     

    (7)点击上面图中的Execute按钮即可进行数据的导入了,然后再进去Query就可查询到导入的数据了哦!!

    或者:http://localhost:8080/solr/collection1/dataimport?command=full-import

    五.安装过程问题 

    1.警告Max Processes Limit

    最大限制用户进程数,个人电脑低配,由于系统需要更改设置

    查看个人最大限制用户进程数 ulimit -u

    [root@node21 software]# vi /etc/security/limits.conf
    末尾添加如下两行信息,保存退出,重新登录生效
    * soft nproc 65535
    * hard nproc 65535

    或者根据官网的建议,在solr.in.sh中设置SOLR_ULIMIT_CHECKS=false 。

    官方老版本solr整合tomcat安装过程参考: https://wiki.apache.org/solr/SolrTomcat

  • 相关阅读:
    mingw-gcc-10.0.1-experimental-i686-posix-sjlj-20200202-0303907
    可以修改 QtScrcpy 窗口大小的小工具
    autosub 添加代理服务器参数 -P --proxy
    Python网络数据采集系列-------概述
    【刷题笔记】I'm stuck! (迷宫)-----java方案
    【刷题笔记】火车购票-----java方案
    mvc自定义全局异常处理
    使用html2canvas实现浏览器截图
    再谈Newtonsoft.Json高级用法
    Spire.Doc组件读取与写入Word
  • 原文地址:https://www.cnblogs.com/haw2106/p/10690563.html
Copyright © 2011-2022 走看看