zoukankan      html  css  js  c++  java
  • Solr(四)Solr实现简单的类似百度搜索高亮功能-1分词器

    IK分词器

    一 效果图

    二 实现此功能需要添加分词器,在这里使用比较主流的IK分词器。

    1 没有配置IK分词器,用solr自带的text分词它会把一句话分成单个的字。

    2 配置IK分词器,的话它会把句子分成词组

    三 下载配置分词器

    1 下载分词器IK

    分词器下载地址:

    http://download.csdn.net/detail/u013292160/9926148
    

    2 解压下载的文件

    3 将ik-analyzer-solr5-5.x.jar这个jar包放入solr项目下的WEB-INFlib目录中,

    我的目录:

    /usr/local/tomcat/apache-tomcat-8.5.13/webapps/solr/WEB-INF/lib
    

    4 将IKAnalyzer.cfg.xml,mydict.dic,stopword.dic放在solr项目下的WEB-INFclasses目录中。

    我的目录:

    /usr/local/tomcat/apache-tomcat-8.5.13/webapps/solr/WEB-INF/classes
    

     

    5 在SolrHome中添加IK分词器

    编辑文件:

     /usr/local/tomcat/apache-tomcat-8.5.13/solr_home/Test/conf/managed-schema
    

    在文件最后</schema>标签中添加如下配置

     <fieldType name="text_ik" class="solr.TextField">
            <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
     </fieldType>
     <field name="text_ik"  type="text_ik" indexed="true"  stored="true"  multiValued="false" />
    

    四 验证分词器是否配置成功

    重启Tomcat并访问Solr客户端,点击analysis,输入测试分词的句子,在下拉列表框选择ik分词器,点击Analyse Value验证是否安装成功分词器,并能正确的进行分词。

     

  • 相关阅读:
    网络学习笔记
    zabbix4.2学习笔记系列
    ansible2.7学习笔记系列
    记一次磁盘UUID不能识别故障处理
    白话ansible-runner--1.环境搭建
    kubernetes的思考
    计算机网络原理精讲第六章--应用层
    计算机网络原理精讲第五章--传输层
    centos7下LVM挂载和扩容
    多线程下载命令--axel
  • 原文地址:https://www.cnblogs.com/Matchman/p/7325182.html
Copyright © 2011-2022 走看看