zoukankan      html  css  js  c++  java
  • solr7中文分词包

    刚刚将solr4升级到了solr7.7,发现之前用的mmseg4j中文分词包用的时候会报错,插入新数据是创建索引会有异常

    possible analysis error: startOffset must be non-negative, and endOffset must be >= startOffset, and offsets must not go backwards startOffset=2,endOffset=8,lastStartOffset=10 for field 'msg'

    应该是mmseg4j跟7.7版本的solr不兼容了,尝试了一下新版本发现mmseg4j已经很久不更新了,尝试了几次还是不行,转向找找其他的分词包,后来发现了ik,主要就一个jar包ik-analyzer,使用方法跟之前的也一样,导入jar包、修改managed-schema、有zookeeper的话可能还需要上传到zk中,并且这个分词包也能方便的支持扩展词典,还是很方便的,具体直接参考原地址https://github.com/magese/ik-analyzer-solr

    登录zookeeper控制台

    /opt/zookeeper-3.4.14/bin/zkCli.sh -server 10.110.30.32:2181

    将solr的配置文件上传到zookeeper

    sh /opt/solr/server/scripts/cloud-scripts/zkcli.sh -zkhost 10.110.30.32:2181 -cmd upconfig -confdir /opt/solr/server/solr/configsets/_default/conf/ -confname _default

  • 相关阅读:
    Python return语句用法分析
    set built-in function
    dict built-in function
    String bulit-in function
    tuple built-in function
    Pyhton:List build-in function
    Python之如果添加扩展包
    关于编辑器
    attachEvent和addEventListener详解
    jquery异步调用页面后台方法
  • 原文地址:https://www.cnblogs.com/yanh0606/p/11121636.html
Copyright © 2011-2022 走看看