zoukankan      html  css  js  c++  java
  • ELK---- Elasticsearch 使用ik中文分词器

    0、默认分词器。

    默认分词器,查询的时候会把中文一个汉字当作一个关键字拆分,这样是不符合我们的需求的,所以需要安装分词器。

    1、下载分词器。

    当前有多种分词器可下载,据说比较好用的是IK分词器。

    注意,下载分词器的时候,版本必须要与Elasticsearch安装的版本一致,否则会出现不可描述的错误。

    下载地址: https://github.com/medcl/elasticsearch-analysis-ik/releases

    注意: es-ik分词插件版本一定要和es安装的版本对应

    之前自带的分词器

    查询地址:http://192.168.5.131:9200/_analyze

    {
      "analyzer": "standard",
      "text": "中华人民共和国中华人民共和国中华人民shiwom是"
    }

    2、安装分词器。

    下载好之后的分词器zip压缩包,上传到服务器中 Elasticsearch的安装目录的plugins目录下。

    用unzip 进行解压。

    linux解压zip文件,命令:unzip 如果没有该命令,可先安装,命令为:

    yum -y install unzip

    安装好后,就解压

    unzip ik.zip

    就OK了,然后kill -9 原来的进程 ,再启动,就可以了。在启动的日志中,我们可以看到,

    3、测试。


    查询地址:http://192.168.5.131:9200/_analyze

    将分词器类型更换为:ik_smart

    {
      "analyzer": "ik_smart",
      "text": "发布之后,谁操作下把2521拿出来"
    }

  • 相关阅读:
    hdu 1595(最短路变形好题)
    hdu 5253(最小生成树)
    hdu 2363(枚举+最短路好题)
    hdu 3440(差分约束好题)
    poj 3169&hdu3592(差分约束)
    hdu 3339(最短路+01背包)
    hdu 2145(迪杰斯特拉)
    CodeForces 581D Three Logos
    CodeForces 510E Fox And Dinner
    CodeForces 484D Kindergarten
  • 原文地址:https://www.cnblogs.com/a393060727/p/12099567.html
Copyright © 2011-2022 走看看