zoukankan      html  css  js  c++  java
  • Solr7.7安装,配置中文分词 IKAnalyzer分词

    ik文件包下载:IK-analyzer   提取码: solr    备用地址下载:IK-analyzer

    配置从下面开始,1到3是必要的步骤,4到6是注释说明文件怎么用的

    1.将ik-analyzer-7.7.0.jar包放入/soft/solr-7.7.0/server/solr-webapp/webapp/WEB-INF/lib/目录下

    cp /soft/ik-analyzer-7.7.0.jar /soft/solr-7.7.0/server/solr-webapp/webapp/WEB-INF/lib/

    2.将resources目录下的5个配置文件放入soft/solr-7.7.0/server/solr-webapp/webapp/WEB-INF/classes/目录下,用客户端工具,直接拖拽到目录下
    ① IKAnalyzer.cfg.xml
    ② ext.dic
    ③ stopword.dic
    ④ ik.conf
    ⑤ dynamicdic.txt

    3.配置Solr的managed-schema,添加ik分词器,示例如下;
    <!-- ik分词器 -->
    <fieldType name="text_ik" class="solr.TextField">
      <analyzer type="index">
          <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
          <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>
      <analyzer type="query">
          <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
          <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>
    </fieldType>

    4.重启Solr服务,测试分词;


    5.ik.conf文件说明:
    files=dynamicdic.txt
    lastupdate=0
    files为动态词典列表,可以设置多个词典表,用逗号进行分隔,默认动态词典表为dynamicdic.txt;
    lastupdate默认值为0,每次对动态词典表修改后请+1,不然不会将词典表中新的词语添加到内存中。


    6.dynamicdic.txt 为动态词典
    在此文件配置的词语不需重启服务即可加载进内存中。 以#开头的词语视为注释,将不会加载到内存中

  • 相关阅读:
    虚拟机CentOS 7 网络连接显示"线缆被拔出"
    sqlplus下删除退格,出现^H^H
    “服务器发送了一个意外的数据包。received:3,expected:20“问题的解决方法
    Oracle 12c创建PDB用户并设置默认表空间
    今日进度
    今日进度
    给王老师的建议
    今日进度
    今日进度
    每周总结
  • 原文地址:https://www.cnblogs.com/caleyun/p/10455985.html
Copyright © 2011-2022 走看看