zoukankan html css js c++ java

Solr6.6 IK 中文分词的配置和使用

　　1. 首先，下载IKAnalyzer ，下载

　　2. 将ik的相关文件拷贝到 webappssolrWEB-INFlib 目录下

　　　或者存放solr-6.6.0serversolr estlib下面，就是在核test下面建立lib文件夹，把对应组件放在lib下面

　　修改solrconfig.xml，增加如下：

 <lib dir="./lib" regex=".*.jar"/>

　　3. 在 solr-6.6.0serversolr estconfmanaged-schema增加如下配置

 <fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index" >
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/CNstopwords.txt" />
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
      <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/CNstopwords.txt" />
    </analyzer>
  </fieldType>

CNstopwords.txt为通用词文件

　　或

<!-- 我添加的IK分词 -->
         <fieldType name="text_ik" class="solr.TextField">   
                   <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
                   <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
         </fieldType>

　　同时，把需要分词的字段，设置为text_ik，

  <field name="pathsummary"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />
  <field name="attr_content"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />

　　4、在admin后台， analysis 下查看分词效果

查看全文

相关阅读:
原生微信小程序砸金蛋奖程序代码分析
 git 如何恢复到指定版本--很常用的方法
 cupload.js手动插入数据
 asp.net Core3.1自定义权限体系-菜单和操作按钮权限
 linux 解决docker、docker-compose命令权限问题（sudo）
Supervisor 安装和使用教程
 php 无限级分类查找父节点所有子节点【找出某节点的子节点】
bat echo 输出内容为不同的颜色
 git 提交团队项目代码的流程
 bat脚本切换到其他盘符

原文地址：https://www.cnblogs.com/shaosks/p/8204615.html