zoukankan      html  css  js  c++  java
  • es中中文分词器的使用

      一直到今天,才打算写这篇文章。我使用的es服务器,是使用docker进行安装的,不像传统的那种安装,分词器要添加到docker里,一直有些头疼。

      es整体都整理好了,进行补充没有实现的一些es知识点。

    1.参考地址

      github:https://github.com/medcl/elasticsearch-analysis-ik/

       码云:https://gitee.com/sky_flying/elasticsearch-analysis-ik?_from=gitee_search

    2.首先看自己的es版本

      

    3.进入docker

      

     4.在线安装

      版本和es一致

      ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.2.0/elasticsearch-analysis-ik-7.2.0.zip

      但是,在线就是有些慢,这里有一个可以先下载下来,然后使用的做法:https://blog.csdn.net/u012211603/article/details/90757253

      本文终止在线安装,从第5开始线下安装。

    5.先进行下载

      https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.2.0/elasticsearch-analysis-ik-7.2.0.zip,输入谷歌浏览器中

      自动进行下载

      下载效果:

      

    6.从本地上传到服务器

      

    7.新建文件夹

      

    8.退出docker

      exit

    9.将ik拷贝进来

      docker cp /opt/data/elasticsearch-analysis-ik-7.2.0 es2:/usr/share/elasticsearch/plugins/ik

      

       效果:

      

    10.解压

      如果不存在unzip,则进入容器中执行yum install unzip,就存在了

      

    11.删除zip包

      

    12.退出重新启动

      

    二:验证

    1.执行

    POST /_analyze
    {
      "analyzer": "ik_smart",
      "text": "我是一个程序员"
    }
    

      效果:

    {
      "tokens" : [
        {
          "token" : "我",
          "start_offset" : 0,
          "end_offset" : 1,
          "type" : "CN_CHAR",
          "position" : 0
        },
        {
          "token" : "是",
          "start_offset" : 1,
          "end_offset" : 2,
          "type" : "CN_CHAR",
          "position" : 1
        },
        {
          "token" : "一个",
          "start_offset" : 2,
          "end_offset" : 4,
          "type" : "CN_WORD",
          "position" : 2
        },
        {
          "token" : "程序员",
          "start_offset" : 4,
          "end_offset" : 7,
          "type" : "CN_WORD",
          "position" : 3
        }
      ]
    }
    

      

      

  • 相关阅读:
    六种简单易理解的排序算法
    leetcode-數組篇
    leetcode-字符串篇
    java8 Optional优雅非空判断
    md2all 简单实用
    zooleeper面试题
    深入理解 JVM锁 与 分布式锁
    redission 高性能分布式锁
    Java传统 定时任务
    关于Zookeeper
  • 原文地址:https://www.cnblogs.com/juncaoit/p/12824818.html
Copyright © 2011-2022 走看看