zoukankan      html  css  js  c++  java
  • 中文分词器

    使用因为Elasticsearch中默认的标准分词器分词器对中文分词不是很友好,会将中文词语拆分成一个一个中文的汉子。因此引入中文分词器-es-ik插件

    在下载使用插件时候 一定要注意 版本对应!

    github地址: https://github.com/medcl/elasticsearch-analysis-ik/releases/

    这个插件里面用到HttpClient 因为要远程获取关键词 拉取网上的热词  还有es通信

    安装:

    第一步:下载es的IK插件(资料中有)命名改为ik插件

    第二步: 上传到/home/elasticsearch-6.4.3/plugins

    第三步:      unzip ik.zip        

    第四步: 重启elasticsearch即可

    使用:分词结果  发送get请求

     自定义热词,扩展词:

    /elasticsearch-6.4.3/plugins/ik/config目录下

    vi custom/new_word.dic  (在ik的目录中的config下(/home/elasticsearch/elasticsearch-6.4.3/plugins/ik/config)创建一个目录 下入下面的内容)

    老铁

    王者荣耀

    洪荒之力

    共有产权房

    一带一路

     修改到指定目录:

     

     然后启动ES:

    成功!

    看看:

  • 相关阅读:
    smbmnt
    smbd
    smbcontrol
    smbclient
    smb.conf
    sleep
    size
    oracle-rman-1
    cURL 学习笔记与总结(5)用 cURL 访问 HTTPS 资源
    Java实现 LeetCode 90 子集 II(二)
  • 原文地址:https://www.cnblogs.com/toov5/p/10296872.html
Copyright © 2011-2022 走看看