failed to find global analyzer [uax_url_email] - 走看看

zoukankan html css js c++ java

failed to find global analyzer [uax_url_email]
ES的默认分词设置是standard，这个在中文分词时就比较尴尬了，会单字拆分，比如我搜索关键词“清华大学”，这时候会按“清”，“华”，“大”，“学”去分词，然后搜出来的都是些“清清的河水”，“中华儿女”，“地大物博”，“学而不思则罔”之类的莫名其妙的结果，这里我们就想把这个分词方式修改一下，于是呢，就想到了ik分词器，有两种ik_smart和ik_max_word。

ik_smart会将“清华大学”整个分为一个词，而ik_max_word会将“清华大学”分为“清华大学”，“清华”和“大学”，按需选其中之一就可以了。

修改默认分词方法(这里修改school_index索引的默认分词为：ik_max_word)：
PUT /my_index { "settings" : { "index" : { "analysis.analyzer.default.type": "ik_max_word" } } }

PUT /my_index/
{
　　"index": {
　　　　"analysis": {
　　　　　　"analyzer": {
　　　　　　　　"content":{
　　　　　　　　　　"tokenizer":"uax_url_email"
　　　　　　　　}
　　　　　　}
　　　　}

　　}
}
　　
查看全文

相关阅读:
IM开发快速入门(一)：什么是IM系统？
IM群聊消息的已读未读功能在存储空间方面的实现思路探讨
 Android保活从入门到放弃：乖乖引导用户加白名单吧(附7大机型加白示例)
IM开发干货分享：我是如何解决大量离线消息导致客户端卡顿的
 LetsTalk_Android中引导用户加入白名单图-2
LetsTalk_Android中引导用户加入白名单图
 基于Go的马蜂窝旅游网分布式IM系统技术实践
 2020年了，Android后台保活还有戏吗？看我如何优雅的实现！
微信团队分享：极致优化，iOS版微信编译速度3倍提升的实践总结
 史上最通俗，彻底搞懂字符乱码问题的本质

原文地址：https://www.cnblogs.com/cbugs/p/10783130.html

Copyright © 2011-2022 走看看