首先安装jdk,我这里使用open-jdk
yum list all | grep jdk
yum -y install java-1.8.0-openjdk-devel, java-1.8.0-openjdk.x86_64和java-1.8.0-openjdk-headless.x86_64作为依赖包
安装
echo "export JAVA_HOME=/usr/bin" > /etc/profile.d/java.sh
exec bash
yum -y install elasticsearch-1.7.2.noarch.rpm 安装elasticsearch
vim /etc/elasticsearch/elasticsearch.yml 编辑配置文件
cluster.name: elasticsearch 为cluster命名为elasticsearch
node.name: "node1" 为该节点命名为node1
service elasticsearch start
ss -tnl 查看9200和9300的端口已经开启
这里的集群我使用三个节点,分别在其他的两个节点以进行同样的配置,注意节点不能相同
配置好后在一个节点上就能抓到包了 tcpdump -i eth1 -nn tcp port 9300
curl 'http://192.168.204.129:9200/?pretty'查看一个节点是否运行正常
显示了"status" : 200 表示运行正常
curl 'http://192.168.204.129:9200/_cat/' 这条命令可以查看一个节点的许多信息
意思是在catAPI下支持很多操作
比如curl 'http://192.168.204.129:9200/_cat/nodes' 显示节点信息
curl 'http://192.168.204.129:9200/_cat/nodes?v' 显示更详细的信息
curl 'http://192.168.204.129:9200/_cat/nodes?help' 获取帮助
curl 'http://192.168.204.131:9200/_cat/indices' 查看索引
还有许多命令此处不做一一介绍
集群的API
例如curl 'http://192.168.204.131:9200/_cluster/health?pretty' 查看健康状态
curl 'http://192.168.204.131:9200/_cluster/health?level=indicies&pretty'
查看到索引的那一个等级
curl 'http://192.168.204.131:9200/_cluster/state?pretty'
查看状态
curl 'http://192.168.204.131:9200/_cluster/stats?pretty'
查看统计信息
集群的API还有许多命令此处不一一做介绍
plugins:
插件扩展ES的功能
添加自定义的映射类型,自定义分析器,本地脚本,自定义发现方式
安装:
直接将插件放置于plugins目录中,目录为/usr/share/elasticsearch/plugins,使用rpm -ql elasticsearch命令查看
使用plugin脚本进行安装,脚本路径为/usr/share/elasticsearch/bin/plugin,/usr/share/elasticsearch/bin/plugin -h列出命令帮
助 -l列出已经安装的插件,-i或者--install, -u之名插件的URL
本地安装示例:/usr/share/elasticsearch/bin/plugin -i marvel -u file:///root/marvel-latest.zip
站点插件:head-master.zip marvel-latest.zip bigdesk-master.zip
这些插件在安装之后可通过浏览器直接访问
示例:http://192.168.204.129:9200/_plugin/marvel
创建文档:
curl -XPUT 'localhost:9200/students/class1/2?pretty' -d '
> {
> "first_name": "Rong",
> "last_name": "Huang",
> "gender": "Female",
> "age": 23,
> "courses": "Luoying Shenjian"
> }'
{
"_index" : "students",
"_type" : "class1",
"_id" : "2",
"_version" : 1,
"created" : true
}
curl -XPUT 'localhost:9200/students/class1/1?pretty' -d '
{
"first_name": "Jing",
"last_name": "Guo",
"gender": "Male",
"age": 25,
"courses": "Xianglong Shiba Zhang"
}'
获取文档:
~]# curl -XGET 'localhost:9200/students/class1/2?pretty'
{
"_index" : "students",
"_type" : "class1",
"_id" : "2",
"_version" : 1,
"found" : true,
"_source":
{
"first_name": "Rong",
"last_name": "Huang",
"gender": "Female",
"age": 23,
"courses": "Luoying Shenjian"
}
}
更新文档:
PUT方法会覆盖原有文档
如果只更新部分内容,得使用_update API
~]# curl -XPOST 'localhost:9200/students/class1/2/_update?pretty' -d '
{
"doc": { "age": 22 }
}'
{
"_index" : "students",
"_type" : "class1",
"_id" : "2",
"_version" : 2
}
删除文档:DETELE ~]# curl -XDELETE 'localhost:9200/students/class1/2'
删除索引: ~]# curl -XDELETE 'localhost:9200/students'
~]# curl -XGET 'localhost:9200/_cat/indices?v'
查询数据: Query API
ES的查询操作执行分为两个阶段:分散阶段 合并阶段
查询方式:向ES发起查询请求的方式有两种
1、通过Restful request API查询,也称为query string
2、通过发送REST request body进行
~]# curl -XGET 'localhost:9200/students/_search?pretty' 不常用
~]# curl -XGET 'localhost:9200/students/_search?pretty' -d '
> {
> "query": { "match_all": {} }
> }' 效果跟前一种是一样的,查询所有结果
多索引、多类型查询:
/_search:所有索引
/INDEX_NAME/_search:单索引
/INDEX1,INDEX2/_search:多索引
/s*,t*/_search 通配符
/students/class1/_search:单类型搜索
/students/class1,class2/_search:多类型搜索
Mapping和Analysis:
ES:对每一个文档,会取得其所有域的所有值,生成一个名为“_all”的域;执行查询时,如果在query_string未指定查询的域,则在
_all域上执行查询操作
curl 'localhost:9200/students/_search?q="Xianglong"&pretty'
curl 'localhost:9200/students/_search?q="Xianglong%20Shiba%20Zhang"&pretty'
curl 'localhost:9200/students/_search?q=courses:"Xianglong%20Shiba%20Zhang"&pretty'
curl 'localhost:9200/students/_search?q=courses:"Xianglong"&pretty'
前两个:表示在_all域搜索; %20代表的是一个空格
后两个:在指定的域上搜索
查询也可以在浏览器的这个地址http://192.168.204.129:9200/_plugin/marvel/sense/ 操作
注意:在指定域上搜索是需要精确匹配的
文档存储的数据类型:string, numbers, boolean, dates
查看指定类型的mapping示例:~]# curl 'localhost:9200/students/_mapping/class1?pretty'
ES中搜索的数据广义上可被理解为两类:
types:exact
full-text
精确值:指未经加工的原始值;在搜索时进行精确匹配;
full-text:用于引用文本中数据;判断文档在多大程序上匹配查询请求;即评估文档与用户请求查询的相关度;
为了完成full-text搜索,ES必须首先分析文本,并创建出倒排索引;倒排索引中的数据还需进行“正规化”为标准格式;
分词
正规化
即分析
分析需要由分析器进行:analyzer
分析器由三个组件构成:字符过滤器、分词器、分词过滤器
ES内置的分析器:
Standard analyzer:(默认)
Simple analyzer
Whitespace analyzer
Language analyzer
分析器不仅在创建索引时用到;在构建查询时也会用到, 在创建和查询时都用同一种分析器