zoukankan      html  css  js  c++  java
  • ES5中文分词(IK)

    ElasticSearch5中文分词(IK)

    ElasticSearch安装

    官网:https://www.elastic.co

    1.ElasticSearch安装

    1.1.下载安装公共密钥

    rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch

    1.2.在 /etc/yum.repos.d/ 目录下建立 elasticsearch.repo 文件

    vim /etc/yum.repos.d/elasticsearch.repo

    在文件中写入:

    复制代码
    [elasticsearch-5.x]
    name=Elasticsearch repository for 5.x packages
    baseurl=https://artifacts.elastic.co/packages/5.x/yum
    gpgcheck=1
    gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
    enabled=1
    autorefresh=1
    type=rpm-md
    复制代码

    保存退出

    1.3.使用yum安装 

    yum install elasticsearch

    1.4.添加系统服务

    chkconfig --add elasticsearch
    service elasticsearch start  //启动
    service elasticsearch stop  //关闭
    service elasticsearch status//查看状态

    启动后访问 localhost:9200  得到

    复制代码
    {
      "name" : "Cp8oag6",
      "cluster_name" : "elasticsearch",
      "cluster_uuid" : "AT69_T_DTp-1qgIJlatQqA",
      "version" : {
        "number" : "5.0.1",
        "build_hash" : "f27399d",
        "build_date" : "2016-11-21T09:51:41.449Z",
        "build_snapshot" : false,
        "lucene_version" : "6.2.1"
      },
      "tagline" : "You Know, for Search"
    }
    复制代码

    2 安装ik中文分词插件

    2.1 ik git地址 https://github.com/medcl/elasticsearch-analysis-ik

    克隆ik

    git clone https://github.com/medcl/elasticsearch-analysis-ik
    git checkout tags/v5.0.1 切换版本 版本号可以修改

    2.2 通过java工具打包  

    mvn package

    如果提示 mvn 不存在看下面

    打包后  在  target/releases/  这个路径下面 有一个 elasticsearch-analysis-ik-{version}.zip 这个文件  将这个压缩文件复制到  ElasticSearch 下plugins/ik 目录下 然后解压

    我的 plugins 目录是  /usr/share/elasticsearch/plugins  这个路

    建立 ik 目录

    mkdir /usr/share/elasticsearch/plugins/ik

    复制文件 

    cp  ./target/releases/elasticsearch-analysis-ik-{version}.zip  /usr/share/elasticsearch/plugins/ik

    解压

    cd /usr/share/elasticsearch/plugins/ik
    unzip elasticsearch-analysis-ik-{version}.zip

    2.3 将ik 插件 安装到 ElasticSearch中

    创建索引m8:

    http put 'http://localhost:9200/m8'

    如果提示http put不存在看下面

    为索引(m8)及类型(logs)下的字段(message)设置分词器(分词器可选ik_smart或ik_max_word):

    复制代码
    http put localhost:9200/m8 -d '{
        "settings" : {
            "analysis" : {
                "analyzer" : {
                    "ik" : {
                        "tokenizer" : "ik_smart"
                    }
                }
            }
        },
        "mappings" : {
            "logs" : {
                "dynamic" : true,
                "properties" : {
                    "message" : {
                        "type" : "string",
                        "analyzer" : "ik_smart"
                    }
                }
            }
        }
    }'
    复制代码

    案例

    http://192.168.199.115:9200/m8/_analyze?analyzer=ik_max_word&text=南京市长江大桥

    结果

    参数说明:

    ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合;

    ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。

    mvn 不存在看下面 解决:

    1.安装java的jdk

    官网下载地址http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html  

     下载rpm包:

    wget  http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.rpm?AuthParam=1479708556_19e817839b0ee72d40569ae8a23689d0

    安装:

    rpm  -ivh jdk-8u111-linux-x64.rpm

    设置环境变量:

    vim  /etc/profile

    在最后添加

    JAVA_HOME=/usr/java/jdk1.8.0_111
    JRE_HOME=/usr/java/jdk1.8.0_111/jre
    PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
    CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
    export JAVA_HOME JRE_HOME PATH CLASSPATH

    立即生效:

    source /etc/profile

    验证:

     java -version

     

    安装 maven 就是 mvn 命令 他需要java 才能运行

    wget http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo -O /etc/yum.repos.d/epel-apache-maven.repo
    yum -y install apache-maven

    http put不存在问题:

    yum install httpie

     转载请注明来源 http://www.cnblogs.com/phpshen/p/6085274.html

    
    
     
    分类: linux
  • 相关阅读:
    Gogs http和ssh地址显示localhost的问题
    SQL Server从读写频繁的大表中删除大批量数据
    Java Spring Boot: Unable to determine jdbc url from datasource
    NPOI导入Excel日期格式的处理
    手把手教你整合最优雅SSM框架
    JDBC链接数据库MySQL 8.0 Public Key Retrieval is not allowed 错误的解决方法
    Vim 入门教程
    jquery.i18n.properties前端国际化方案
    生产者消费者模式中条件判断是使用while而不是if
    ThreadPoolExecutor 中的 shutdown() 、 shutdownNow() 、 awaitTermination() 的用法和区别
  • 原文地址:https://www.cnblogs.com/Leo_wl/p/6108802.html
Copyright © 2011-2022 走看看