zoukankan      html  css  js  c++  java
  • elasticsearch6.1.3 集成分词器

    # 安装分词器,分词器版本需要和es版本完全匹配,重启es

    ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.1.3/elasticsearch-analysis-ik-6.1.3.zip

    # 创建索引:

    通过页面创建,单节点情况下务必设置分片为1,副本为0

    # 创建mapping:(相当于对索引结构进行描述,text类型默认分词,如果不分词则用keyword),强烈建议在空索引上设置
    curl -H "Content-Type: application/json" -XPOST http://192.168.30.8:9200/microarch/doc/_mapping -d'
    {
            "properties": {
                "content": {
                    "type": "text",
                    "analyzer": "ik_max_word",
                    "search_analyzer": "ik_max_word"
                }
            }
        
    }'

    # 测试数据

    curl -H "Content-Type: application/json" -XPOST http://192.168.30.8:9200/microarch/doc/1 -d'
    {"content":"美国留给伊拉克的是个烂摊子吗"}'

    curl -H "Content-Type: application/json" -XPOST http://192.168.30.8:9200/microarch/doc/2 -d'
    {"content":"公安部:各地校车将享最高路权"}'

    curl -H "Content-Type: application/json" -XPOST http://192.168.30.8:9200/microarch/doc/3 -d'
    {"content":"中韩渔警冲突调查:韩警平均每天扣1艘中国渔船"}'

    curl -H "Content-Type: application/json" -XPOST http://192.168.30.8:9200/microarch/doc/4 -d'
    {"content":"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"}'

    # 查询
    curl -H "Content-Type: application/json" -XPOST http://192.168.30.8:9200/microarch/doc/_search  -d'
    {
        "query" : { "match" : { "content" : "中国" }},
        "highlight" : {
            "pre_tags" : ["<tag1>", "<tag2>"],
            "post_tags" : ["</tag1>", "</tag2>"],
            "fields" : {
                "content" : {}
            }
        }
    }
    '

  • 相关阅读:
    NLP 基础问题及解析
    linux 命令精简
    linux 文件属性及操作
    linux 文件编辑命令vim
    NLP attention 简述
    数据结构
    2020 走进新时代
    条件随机场CRF 摘要
    linux的jdk、tomcat、tomcat安装等
    VMware所在磁盘满了、linux中date修改、ssh、eclipse的使用问题等
  • 原文地址:https://www.cnblogs.com/rigid/p/10273107.html
Copyright © 2011-2022 走看看