[ElasticSearch]Java API 之词条查询（Term Level Query）

zoukankan html css js c++ java

[ElasticSearch]Java API 之词条查询（Term Level Query）
1. 词条查询(Term Query)

词条查询是ElasticSearch的一个简单查询。它仅匹配在给定字段中含有该词条的文档，而且是确切的、未经分析的词条。term 查询会查找我们设定的准确值。term 查询本身很简单，它接受一个字段名和我们希望查找的值。

下面代码查询将匹配 college 字段中含有"California"一词的文档。记住，词条查询是未经分析的，因此需要提供跟索引文档中的词条完全匹配的词条。请注意，我们使用小写开头的california来搜索，而不是California，因为California一词在建立索引时已经变成了california（默认分词器）。
/**

public static void termQuery(Client client, String index, String type) {

// Query

TermQueryBuilder termQueryBuilder = QueryBuilders.termQuery("country", "AWxhOn".toLowerCase());

// Search

SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);

.setTypes(type);

.setQuery(termQueryBuilder);

// 执行

SearchResponse searchResponse = searchRequestBuilder.get();

// 结果

(searchResponse);

}
参考：https://www.elastic.co/guide/en/elasticsearch/reference/2.4/query-dsl-term-query.html

2. 多词条查询(Terms Query)

词条查询（Term Query）允许匹配单个未经分析的词条，多词条查询（Terms Query）可以用来匹配多个这样的词条。只要指定字段包含任一我们给定的词条，就可以查询到该文档。

下面代码得到所有在 country 字段中含有 “德国” 或 "比利时" 的文档。
/**

public static void termsQuery(Client client, String index, String type) {

// Query

TermsQueryBuilder termsQueryBuilder = QueryBuilders.termsQuery("country", "比利时", "德国");

// Search

SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);

.setTypes(type);

.setQuery(termsQueryBuilder);

// 执行

SearchResponse searchResponse = searchRequestBuilder.get();

// 结果

(searchResponse);

}
输出结果：
- .sjf.open.api.QueryAPI - ---------- QueryAPI id 9 score 0.4898842 source {country=比利时, name=阿扎尔, club=切尔西俱乐部}
- .sjf.open.api.QueryAPI - ---------- QueryAPI id 4 score 0.39103588 source {country=德国, name=穆勒, club=拜仁慕尼黑俱乐部}
- .sjf.open.api.QueryAPI - ---------- QueryAPI id 1 score 0.25427115 source {country=比利时, name=德布劳内, club=曼城俱乐部}
参考：https://www.elastic.co/guide/en/elasticsearch/reference/2.4/query-dsl-terms-query.html

3. 范围查询(Range Query)

范围查询使我们能够找到在某一字段值在某个范围里的文档，字段可以是数值型，也可以是基于字符串的。范围查询只能针对单个字段。

方法：

（1）gte() :范围查询将匹配字段值大于或等于此参数值的文档。

（2）gt() :范围查询将匹配字段值大于此参数值的文档。

（3）lte() :范围查询将匹配字段值小于或等于此参数值的文档。

（4）lt() :范围查询将匹配字段值小于此参数值的文档。

（5）from() 开始值 to() 结束值这两个函数与includeLower()和includeUpper()函数配套使用。

includeLower(true) 表示 from() 查询将匹配字段值大于或等于此参数值的文档；

includeLower(false) 表示 from() 查询将匹配字段值大于此参数值的文档；

includeUpper(true) 表示 to() 查询将匹配字段值小于或等于此参数值的文档；

includeUpper(false) 表示 to() 查询将匹配字段值小于此参数值的文档；
- /**
- public static void rangeQuery(Client client, String index, String type) {
- // Query
- RangeQueryBuilder rangeQueryBuilder = QueryBuilders.rangeQuery("age");
- .from(19);
- .to(21);
- .includeLower(true);
- .includeUpper(true);
- //RangeQueryBuilder rangeQueryBuilder = QueryBuilders.rangeQuery("age").gte(19).lte(21);
- // Search
- SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);
- .setTypes(type);
- .setQuery(rangeQueryBuilder);
- // 执行
- SearchResponse searchResponse = searchRequestBuilder.execute().actionGet();
- // 结果
- (searchResponse);
- }
上面代码中的查询语句与下面的是等价的：
- QueryBuilder queryBuilder = QueryBuilders.rangeQuery("age").gte(19).lte(21);
输出结果：
- .sjf.open.api.QueryAPI - ---------- QueryAPI id 9 score 1.0 source {college=计算机学院, school=麻省理工大学, sex=boy, name=廖力生, age=21}
- .sjf.open.api.QueryAPI - ---------- QueryAPI id 2 score 1.0 source {college=通信学院, school=西安电子科技大学, sex=boy, name=李源一, age=19}
- .sjf.open.api.QueryAPI - ---------- QueryAPI id 4 score 1.0 source {college=电子工程学院, school=中国科技大学, sex=girl, name=王俊辉, age=21}
- .sjf.open.api.QueryAPI - ---------- QueryAPI id 1 score 1.0 source {college=计算机学院, school=西安电子科技大学, sex=boy, name=徐欣, age=21}
- .sjf.open.api.QueryAPI - ---------- QueryAPI id 11 score 1.0 source {college=计算机学院ddddd, school=中国科技大学, sex=girl, name=王俊辉2, age=21}
参考：https://www.elastic.co/guide/en/elasticsearch/reference/2.4/query-dsl-range-query.html

4. 存在查询(Exists Query)

如果指定字段上至少存在一个no-null的值就会返回该文档。
- /**
- public static void existsQuery(Client client, String index, String type) {
- // Query
- ExistsQueryBuilder existsQueryBuilder = QueryBuilders.existsQuery("name");
- // Search
- SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);
- .setTypes(type);
- .setQuery(existsQueryBuilder);
- // 执行
- SearchResponse searchResponse = searchRequestBuilder.get();
- // 结果
- (searchResponse);
- }
举例说明，下面的几个文档都会得到上面代码的匹配：
- 第一个是字符串，是一个非null的值。
  第二个是空字符串，也是非null。
  
  第三个使用标准分析器的情况下尽管不会返回词条，但是原始字段值是非null的（Even though the standard analyzer would emit zero tokens, the original field is non-null）。
  
  第五个中至少有一个是非null值。
  
  下面几个文档不会得到上面代码的匹配：
- "bar" }
- 第一个是null值。
  
  第二个没有值。
  
  第三个只有null值，至少需要一个非null值。
  
  第四个与指定字段不匹配。
  
  参考：https://www.elastic.co/guide/en/elasticsearch/reference/2.4/query-dsl-exists-query.html
  
  5. 前缀查询（Prefix Query）
  
  前缀查询让我们匹配这样的文档：它们的特定字段已给定的前缀开始。下面代码中我们查询所有country字段以"葡萄"开始的文档。
- /**
- public static void prefixQuery(Client client, String index, String type) {
- // Query
- PrefixQueryBuilder prefixQueryBuilder = QueryBuilders.prefixQuery("country", "葡萄");
- // Search
- SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);
- .setTypes(type);
- .setQuery(prefixQueryBuilder);
- // 执行
- SearchResponse searchResponse = searchRequestBuilder.get();
- // 结果
- (searchResponse);
- }
- 输出结果：
- .sjf.open.api.QueryAPI - ---------- QueryAPI id 3 score 1.0 source {country=葡萄牙, name=C罗, club=皇家马德里俱乐部}
- 备注：
  
  进行下面前缀查询，没有查找到相应信息，但是数据源中是有的：
- QueryBuilder queryBuilder = QueryBuilders.prefixQuery("club", "皇家马德里");
- 产生以上差别的主要原因是club字段（默认mapping配置）进行了分析器分析了，索引中的数据已经不在是"皇家马德里"，而country字段没有进行分析（mapping配置not_analyzed）。
  
  参考：https://www.elastic.co/guide/en/elasticsearch/reference/2.4/query-dsl-prefix-query.html
  
  6. 通配符查询(Wildcard Query)
  
  通配符查询允许我们获取指定字段满足通配符表达式的文档，和前缀查询一样，通配符查询指定字段是未分析的（not analyzed）。
  
  可以使用星号代替0个或多个字符，使用问号代替一个字符。星号表示匹配的数量不受限制，而后者的匹配字符数则受到限制。这个技巧主要用于英文搜索中，如输入““computer*”，就可以找到“computer、computers、computerised、computerized”等单词，而输入“comp?ter”，则只能找到“computer、compater、competer”等单词。注意的是通配符查询不太注重性能，在可能时尽量避免，特别是要避免前缀通配符（以以通配符开始的词条）。
- /**
- public static void wildcardQuery(Client client, String index, String type){
- // Query
- WildcardQueryBuilder wildcardQueryBuilder = QueryBuilders.wildcardQuery("country", "西*牙");
- // Search
- SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);
- .setTypes(type);
- .setQuery(wildcardQueryBuilder);
- // 执行
- SearchResponse searchResponse = searchRequestBuilder.get();
- // 结果
- (searchResponse);
- }
- 输出结果：
- .sjf.open.api.queryAPI.TermQueryAPI - ---------- TermQueryAPI id 8 score 1.0 source {country=西班牙, name=托雷斯, club=马德里竞技俱乐部}
- .sjf.open.api.queryAPI.TermQueryAPI - ---------- TermQueryAPI id 6 score 1.0 source {country=西班牙, name=布斯克茨, club=巴萨罗那俱乐部}
- .sjf.open.api.queryAPI.TermQueryAPI - ---------- TermQueryAPI id 7 score 1.0 source {country=西班牙, name=哈维, club=巴萨罗那俱乐部}
- 参考：https://www.elastic.co/guide/en/elasticsearch/reference/2.4/query-dsl-wildcard-query.html
  
  7. 正则表达式查询(Regexp Query)
  
  正则表达式查询允许我们获取指定字段满足正则表达式的文档，和前缀查询一样，正则表达式查询指定字段是未分析的（not analyzed）。正则表达式查询的性能取决于所选的正则表达式。如果我们的正则表达式匹配许多词条，查询将很慢。一般规则是，正则表达式匹配的词条数越高，查询越慢。
- /**
- public static void regexpQuery(Client client, String index, String type){
- // Query
- RegexpQueryBuilder regexpQueryBuilder = QueryBuilders.regexpQuery("country", "(西班|葡萄)牙");
- // Search
- SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);
- .setTypes(type);
- .setQuery(regexpQueryBuilder);
- // 执行
- SearchResponse searchResponse = searchRequestBuilder.get();
- // 结果
- (searchResponse);
- }
- 输出结果：
- .sjf.open.api.queryAPI.TermQueryAPI - ---------- TermQueryAPI id 8 score 1.0 source {country=西班牙, name=托雷斯, club=马德里竞技俱乐部}
- .sjf.open.api.queryAPI.TermQueryAPI - ---------- TermQueryAPI id 6 score 1.0 source {country=西班牙, name=布斯克茨, club=巴萨罗那俱乐部}
- .sjf.open.api.queryAPI.TermQueryAPI - ---------- TermQueryAPI id 7 score 1.0 source {country=西班牙, name=哈维, club=巴萨罗那俱乐部}
- .sjf.open.api.queryAPI.TermQueryAPI - ---------- TermQueryAPI id 3 score 1.0 source {country=葡萄牙, name=C罗, club=皇家马德里俱乐部}
- 参考：https://www.elastic.co/guide/en/elasticsearch/reference/2.4/query-dsl-regexp-query.html
  
  8. 模糊查询(Fuzzy Query)
  
  如果指定的字段是string类型，模糊查询是基于编辑距离算法来匹配文档。编辑距离的计算基于我们提供的查询词条和被搜索文档。如果指定的字段是数值类型或者日期类型，模糊查询基于在字段值上进行加减操作来匹配文档（The fuzzy query uses similarity based on Levenshtein edit distance for fields, and a margin on numeric and date fields）。此查询很占用CPU资源，但当需要模糊匹配时它很有用，例如，当用户拼写错误时。另外我们可以在搜索词的尾部加上字符 “~” 来进行模糊查询。
  
  8.1 string类型字段
  
  模糊查询生成所有可能跟指定词条的匹配结果（在fuzziness指定的最大编辑距离范围之内）。然后检查生成的所有结果是否是在索引中。
  
  下面代码中模糊查询country字段为”西班牙“的所有文档，同时指定最大编辑距离为1（fuzziness），最少公共前缀为0（prefixLength），即不需要公共前缀。
- /**
- public static void fuzzyQuery(Client client, String index, String type){
- // Query
- FuzzyQueryBuilder fuzzyQueryBuilder = QueryBuilders.fuzzyQuery("country", "洗班牙");
- // 最大编辑距离
- .fuzziness(Fuzziness.ONE);
- // 公共前缀
- .prefixLength(0);
- // Search
- SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);
- .setTypes(type);
- .setQuery(fuzzyQueryBuilder);
- // 执行
- SearchResponse searchResponse = searchRequestBuilder.get();
- // 结果
- (searchResponse);
- }
- 输出结果：
- .sjf.open.api.queryAPI.TermQueryAPI - ---------- TermQueryAPI id 8 score 1.6931472 source {country=西班牙, name=托雷斯, club=马德里竞技俱乐部}
- .sjf.open.api.queryAPI.TermQueryAPI - ---------- TermQueryAPI id 6 score 1.4054651 source {country=西班牙, name=布斯克茨, club=巴萨罗那俱乐部}
- .sjf.open.api.queryAPI.TermQueryAPI - ---------- TermQueryAPI id 7 score 1.0 source {country=西班牙, name=哈维, club=巴萨罗那俱乐部}
- 8.2 数字和日期类型字段
  
  与范围查询(Range Query)的around比较类似。形成在指定值上上下波动fuzziness大小的一个范围：
- field value <= +fuzziness
- 下面代码在18岁上下波动2岁，形成[17-19]的一个范围查询：
- /**
- public static void fuzzyQuery2(Client client, String index, String type){
- // Query
- FuzzyQueryBuilder fuzzyQueryBuilder = QueryBuilders.fuzzyQuery("age", "18");
- .fuzziness(Fuzziness.TWO);
- // Search
- SearchRequestBuilder searchRequestBuilder = client.prepareSearch(index);
- .setTypes(type);
- .setQuery(fuzzyQueryBuilder);
- // 执行
- SearchResponse searchResponse = searchRequestBuilder.get();
- // 结果
- (searchResponse);
- }
- 参考：https://www.elastic.co/guide/en/elasticsearch/reference/2.4/query-dsl-fuzzy-query.html
  
  9. 说明
  
  本代码基于ElasticSearch 2.4.1
查看全文

相关阅读:
解决 DBMS_AW_EXP: BIN$*****==$0 not AW$
物化视图(materialized view) 实现数据迁移、数据定时同步
 Mysql exists 与 in
ORACLE DATAGUARD 进程
 ORACLE DATAGUARD SWITCHOVER 步骤
 Oracle Dataguard failover 操作步骤
 Python 包管理(PYPA)
Emacs Org-mode 4 超连接
 Emacs Org-mode 3 表格
 ycmd for emacs 代码自动补全

原文地址：https://www.cnblogs.com/austinspark-jessylu/p/6878370.html

[ElasticSearch]Java API 之 词条查询（Term Level Query）

2. 多词条查询(Terms Query)

3. 范围查询(Range Query)

4. 存在查询(Exists Query)

5. 前缀查询（Prefix Query）

6. 通配符查询(Wildcard Query)

7. 正则表达式查询(Regexp Query)

8. 模糊查询(Fuzzy Query)

8.1 string类型字段

8.2 数字和日期类型字段

9. 说明

[ElasticSearch]Java API 之词条查询（Term Level Query）