目录
一、建索引需要了解
settings:配置信息
number_of_replicas: 0 不需要备份(单节点的ElasticSearch使用)
mappings: 映射内容
dynamic:false 是否动态索引,这里使用的是false,表示索引的固定的,不需要修改。
properties: 属性结构内容
index:true 是否设置分词
type:数据类型,text文本(长字符串),integer数字,date时间,keyword单词
analuzer:存储时使用的分词器
searchAnalyze:搜索时使用的分词器
store:是否存储
二、基础操作
1.添加索引
data:image/s3,"s3://crabby-images/dfbf6/dfbf6d92e0e540ef60c6fcdceeb297187120079c" alt=""
{
"mappings": {
"properties": {
"id": {
"type": "long",
"store": true,
"index": false
},
"title": {
"type": "text",
"store": true,
"index": true,
"analyzer": "standard"
},
"content": {
"type": "text",
"store": true,
"index": true,
"analyzer": "standard"
}
}
}
}
添加成功:
{
"acknowledged": true,
"shards_acknowledged": true,
"index": "blog2"
}
2.删除索引
data:image/s3,"s3://crabby-images/fc2fa/fc2fa923f318cf8e298e57d9feddb1f17f256c67" alt=""
3.添加文档
data:image/s3,"s3://crabby-images/6d8f1/6d8f14761a0997a2feaa05491c4fbce94bf14766" alt=""
使用ElasticSearch-Head图形化工具查看
data:image/s3,"s3://crabby-images/c23fa/c23fa031cbf47563953a2f1230385802fa9793e8" alt=""
4.修改文档
data:image/s3,"s3://crabby-images/e34d1/e34d16ca9ad2b02702244836c1ee418f41e9e57e" alt=""
查看
data:image/s3,"s3://crabby-images/65533/65533e1c4944ed278f90572bdc926de2c7767ae5" alt=""
5.删除文档
data:image/s3,"s3://crabby-images/ad1a1/ad1a190862ce2159232239788a3c379ae3195bdf" alt=""
data:image/s3,"s3://crabby-images/2f2c8/2f2c8620eba1b5ca9efd2af18151c5a13e081c97" alt=""
6.查询文档
- 根据id查
data:image/s3,"s3://crabby-images/7620d/7620d1394ce7f0067c9ed0ccf54290ecdab822dc" alt=""
- 根据QueryString
data:image/s3,"s3://crabby-images/a7862/a7862a702e94d345b9d85aaa69bc28bdbc26c00d" alt=""
将搜索内容"分布式全文检索引擎"修改为"搜索",同样也能搜索到文档,这是为什么?
- term查询
data:image/s3,"s3://crabby-images/b8496/b849651d0087d2d60b4684945bd5bc85c14b3322" alt=""
查询结果为0
将搜索内容"分布式全文检索引擎"修改为"搜索",同样也不能搜索到文档,这又是为什么?
三、IK分词器与ES集成
在进行字符串查询时,我们发现去搜索"搜索服务器"和"搜索"都可以搜索到数据,而在进行词条查询时,我们都没有搜索到数据;
究其原因是ElasticSearch的标准分词器导致的,当我们创建索引时,字段使用的是标准分词器:
"analyzer": "standard"
现对 "分布式全文检索引擎" 进行标准分词器分词 ,测试效果:
data:image/s3,"s3://crabby-images/379c9/379c944d8dcb2a25147aa51d5fc57e5a9e7f5dbf" alt=""
发现standard对中文的支持不够良好
1.IKAnalyzer简介
是一个开源的,基于java语言开发的轻量级的中文分词工具包。提供了对 Lucene的默认优化实现。
2.IK分词器安装
下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases/
下载完成将解压到elasticsearch-7.5.2plugins下,并重新启动es服务
data:image/s3,"s3://crabby-images/c8bf2/c8bf2c7591417386ff39734e3e56e1a5e94a30c3" alt=""
3.IK分词器测试
IK提供了两个分词算法ik_smart 和 ik_max_word ,其中 ik_smart 为最少切分,ik_max_word为最细粒度划分
data:image/s3,"s3://crabby-images/21a43/21a4316f70dbf36e9e3c34c62330b3c39e23e005" alt=""
分词效果ik_smart 是:分布式—全文—检索—引擎,ik_max_word 是:分布式—分布—式—全文—检索—引擎,还是有区别的..
4.重新配置索引映射mapping并添加文档
"analyzer": "ik_max_word"
再次测试:
data:image/s3,"s3://crabby-images/b1997/b1997fad6bbf54ca331b2e196b628ebacc50335a" alt=""
而用term就能搜索出来