一、基本概念及缘由
1.Sql vs nosql
SQL:Structured Query Language
Nosql:Not only SQL
Relationship DB
Relations:One-to-one relation、One-to-many、Many-to-many、Self-reference
Mongo DB(humongous 大量的)、Redis .ect (内存型数据库)
Structure:Database Collencitons Documents
2.为何使用搜索引擎
项目中的搜索功能,如果数据量较小,那么可以直接使用mysql进行搜索;当数据量到达一定规模后,比如十亿、百亿,这时传统的关系型数据库就已经达到性能瓶颈,不适合这个项目,此时可以使用搜索引擎ElasticSearch。可能你会问,为什么不用内存型数据库。虽然内存型数据库读写性能很高,但是将庞大的数据量全都装进内存中不太现实。比如,使用PB级别的数据,每个内存节点96G的话,那么需要上万个节点,再考虑到数据的备份,那么会更多。这么高的成本,不现实。软件是服务于企业的,企业的目的是盈利。
3.初步认识ElasticSearch
目前常见的搜索引擎的首选,就是开源的ElasticSearch。它可以快速存储、搜索和分析海量数据。它的底层是开源库Lucene(Lucene必须手动去写接口进行调用)。Elastic对Lucene进行了封装,提供了基于Rest API的接口,可以直接操作接口。
(official document path : https://www.elastic.co/guide/en/elasticsearch/reference/current/rest-apis.html)
学习环境:elasticsearch-7.5.2 windows 10
3.1 基本概念
※Node、Cluster※
ElasticSearch的本质是分布式数据库,因此就会有节点(Node),一个节点相当于一个实例,一组节点构成集群(cluster)。
※Index※ES会给所有存储的数据建立索引,经过处理后会有个反向索引。查找数据时直接查找该索引。
※Document※
插入ES中的每条记录都是一个Document。它也是使用JSON格式,多个Document构成了一个Index。
※Type※
分组的类型。
e.g. curl -X PUT "localhost:9200/customer/_doc/3?pretty" -H "Content-Type: application/json" -d "{"name": "John Lee3"}"
customer 是Index的名字。_doc是type名字。3表示该条记录的ID,它不一定是数字,任意字符串(如:“adc”)都可以。添加数据时,也可以不指定ID,这时,会自动添加一个随机字符串的ID。pretty表示易读的格式返回。
3.2 Get Started
(1)install path https://www.elastic.co/guide/en/elasticsearch/reference/current/install-elasticsearch.html
(2)Run bin/elasticsearch (or binelasticsearch.bat on Windows)
(3)Run curl http://localhost:9200/
3.3 memo
我照着官网学习时,用到的命令,复制下来备用。下面命令我亲自执行过,没有问题。
curl -X GET "localhost:9200/_cat/health?v&pretty"
curl -X PUT "localhost:9200/customer/_doc/3?pretty" -H "Content-Type: application/json" -d "{"name": "John Lee3"}"
curl -H "Content-Type: application/json" -XPOST "localhost:9200/bank/_bulk?pretty&refresh" --data-binary "@accounts.json"
curl -X GET "localhost:9200/customer/_doc/1?pretty"
curl "localhost:9200/_cat/indices?v"
curl -X GET "localhost:9200/bank/_search?pretty" -H "Content-Type: application/json" -d "{"query": { "match_all": {} },"sort": [{ "account_number": "asc" }]}"
curl -X GET "localhost:9200/bank/_search?pretty" -H "Content-Type: application/json" -d"
{
"query": { "match_all": {} },
"sort": [
{ "account_number": "asc" }
],
"from": 10,
"size": 10
}"
curl -X GET "localhost:9200/bank/_search?pretty" -H "Content-Type: application/json" -d"{ "query": { "match": { "address": "mill lane" } }}"
4.踩坑
1.使用curl命令时,注意事项。(环境:windows环境,在cmd.exe下执行的curl命令)
一定要注意双引号以及转义字符。切记。按照官网复制来的命令,会有问题。
curl -H "Content-Type: application/json" -X POST -d "{"abc":123}" "https://httpbin.org/post"
参考文档:
https://blog.csdn.net/aisemi/article/details/80212836
https://www.elastic.co/guide/en/elasticsearch/reference/current/elasticsearch-intro.html Elasticsearch official guides
http://www.ruanyifeng.com/blog/2017/08/elasticsearch.html
※