zoukankan      html  css  js  c++  java
  • es(六)ElasticSearch的java编程操作

    1.创建工程,导入坐标

    <dependencies>
        <dependency>
            <groupId>org.elasticsearch</groupId>
            <artifactId>elasticsearch</artifactId>
            <version>5.6.8</version>
        </dependency>
        <dependency>
            <groupId>org.elasticsearch.client</groupId>
            <artifactId>transport</artifactId>
            <version>5.6.8</version>
        </dependency>
        <dependency>
            <groupId>org.apache.logging.log4j</groupId>
            <artifactId>log4j-to-slf4j</artifactId>
            <version>2.9.1</version>
        </dependency>
        <dependency>
            <groupId>org.slf4j</groupId>
            <artifactId>slf4j-api</artifactId>
            <version>1.7.24</version>
        </dependency>
        <dependency>
            <groupId>org.slf4j</groupId>
            <artifactId>slf4j-simple</artifactId>
            <version>1.7.21</version>
        </dependency>
        <dependency>
            <groupId>log4j</groupId>
            <artifactId>log4j</artifactId>
            <version>1.2.12</version>
        </dependency>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>4.12</version>
        </dependency>
    </dependencies>
    

    2.创建索引index

    步骤

    • 创建一个Setting对象,相当于是一个配置信息。主要配置集群的名称
    • 创建一个客户端Client对象
    • 使用client对象创建一个索引库
    • guanbiclient对象

    代码

    @Test
    //创建索引
    public void test1() throws Exception{
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-elasticsearch").build();
        TransportClient client = new PreBuiltTransportClient(settings)
            .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
        //创建名称为blog2的索引
        client.admin().indices().prepareCreate("blog2").get();
        //释放资源
        client.close();
    }
    

    3.创建映射mapping

    3.1步骤

    • 创建一个settings对象
    • 创建一个Client对象
    • 创建一个mapping信息,应该是一个json数据,可以使字符串,也可以是XContextBuilder对象是es客户端提供的对象
    • 使用client向es服务发送mapping信息
    • 关闭client对象

    3.2代码

    @Test
    //创建映射
    public void test3() throws Exception{
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-elasticsearch").build();
        TransportClient client = new PreBuiltTransportClient(settings)
            .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
        
        // 添加映射
        /**
             * 格式:
             * "mappings" : {
                 "article" : {
                    "dynamic" : "false",
                     "properties" : {
                        "id" : { "type" : "string" },
                         "content" : { "type" : "string" },
                        "author" : { "type" : "string" }
                     }
                }
             }
             */
        XContentBuilder builder = XContentFactory.jsonBuilder()
            .startObject()
            .startObject("article")
            .startObject("properties")
            .startObject("id")
            .field("type", "integer").field("store", "yes")
            .endObject()
            .startObject("title")
            .field("type", "string").field("store", "yes").field("analyzer", "ik_smart")
            .endObject()
            .startObject("content")
            .field("type", "string").field("store", "yes").field("analyzer", "ik_smart")
            .endObject()
            .endObject()
            .endObject()
            .endObject();
        //使用client把mapping信息设置到索引库中
        client.admin().indices()
                //设置要做映射的索引
                .preparePutMapping("index_hello")
                //设置要做映射的type
                .setType("article")
                //mapping信息,可以是XContentBuilder对象,可以使json格式的字符串
                .setSource(builder)
                //执行操作
                .get();
        //关闭
        client.close();
    
    
        // 创建映射----这种方式只做了解,推荐上面的方式
        /*PutMappingRequest mapping = Requests.putMappingRequest("blog2")
            .type("article").source(builder);
        client.admin().indices().putMapping(mapping).get();
        //释放资源
        client.close();*/
    }
    


    4.建立文档document

    步骤:

    • 创建一个setting对象
    • 创建一个Client对象
    • 创建一个文档对象,创建一个json格式的字符串,或者使用XContentBuilder
    • 使用Client对象把文档添加到索引库中
    • 关闭Client

    --4.1建立文档(通过XContentBuilder)

    @Test
    //创建文档(通过XContentBuilder)
    public void test4() throws Exception{
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-elasticsearch").build();
        TransportClient client = new PreBuiltTransportClient(settings)
            .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
    
        //创建文档信息
        XContentBuilder builder = XContentFactory.jsonBuilder()
            .startObject()
            .field("id", 1)
            .field("title", "ElasticSearch是一个基于Lucene的搜索服务器")
            .field("content",
                   "它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。")
            .endObject();
    
        // 建立文档对象
        /**
             * 参数一blog1:表示索引对象
             * 参数二article:类型
             * 参数三1:建立id
             */
        client.prepareIndex("blog2", "article", "1").setSource(builder).get();
    
        //释放资源
        client.close();
    }
    

    --4.2建立文档(使用Jackson转换实体)

    • 1)创建Article实体
    public class Article {
    	private Integer id;
    	private String title;
    	private String content;
        getter/setter...
    }
    
    • 2)添加jackson坐标(springBoot自带)
    <dependency>
        <groupId>com.fasterxml.jackson.core</groupId>
        <artifactId>jackson-core</artifactId>
        <version>2.8.1</version>
    </dependency>
    <dependency>
        <groupId>com.fasterxml.jackson.core</groupId>
        <artifactId>jackson-databind</artifactId>
        <version>2.8.1</version>
    </dependency>
    <dependency>
        <groupId>com.fasterxml.jackson.core</groupId>
        <artifactId>jackson-annotations</artifactId>
        <version>2.8.1</version>
    </dependency>
    
    • 3)代码实现
    @Test
    //创建文档(通过实体转json)
    public void test5() throws Exception{
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-elasticsearch").build();
        TransportClient client = new PreBuiltTransportClient(settings)
            .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
    
        // 描述json 数据
        //{id:xxx, title:xxx, content:xxx}
        Article article = new Article();
        article.setId(2);
        article.setTitle("搜索工作其实很快乐");
        article.setContent("我们希望我们的搜索解决方案要快,我们希望有一个零配置和一个完全免费的搜索模式,我们希望能够简单地使用JSON通过HTTP的索引数据,我们希望我们的搜索服务器始终可用,我们希望能够一台开始并扩展到数百,我们要实时搜索,我们要简单的多租户,我们希望建立一个云的解决方案。Elasticsearch旨在解决所有这些问题和更多的问题。");
    
        ObjectMapper objectMapper = new ObjectMapper();
    
        // 建立文档
        client.prepareIndex("blog2", "article", article.getId().toString())
            //.setSource(objectMapper.writeValueAsString(article)).get();
            .setSource(objectMapper.writeValueAsString(article).getBytes(), XContentType.JSON).get();
    
        //释放资源
        client.close();
    }
    

    5.查询文档操作

    步骤:

    • 创建一个client对象
    • 创建一个查询对象,可以使用QueryBuilder工具类创建QueryBuilder对象
    • 使用client执行查询
    • 得到查询的结果
    • 得到查询结果的总记录数
    • 得到查询结果的列表
    • 关闭client

    --5.1使用文档ID查询文档

    @Test
    public void testTermQuery() throws Exception{
        //1、创建es客户端连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-elasticsearch").build();
        TransportClient client = new PreBuiltTransportClient(settings)
            .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
    
        //2、设置搜索条件
       /* 用下面的内容代替注释部分
    SearchResponse response = client.prepareSearch("blog1")
                    .setTypes("article")
                    //设置要查询的id
                    .setQuery(QueryBuilders.idsQuery().addIds("test002"))
                    //执行查询
                    .get();
    */
        //创建一个查询对象
        QueryBuilder queryBuilder = QueryBuilder.idsQuery().addIds("1","2");//queryBuilder是查询条件
        //执行查询
        SearchResponse searchResponse = client.prepareSearch("index_hello")
                    .setType("article")
                    .setQuery(queryBuilder)
                    .get();
        //取查询结果
    
        //3、遍历搜索结果数据
        SearchHits hits = searchResponse.getHits(); // 获取命中次数,查询结果有多少对象
        System.out.println("查询结果有:" + hits.getTotalHits() + "条");
        Iterator<SearchHit> iterator = hits.iterator();
        while (iterator.hasNext()) {
            SearchHit searchHit = iterator.next(); // 每个查询对象
            System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印,以json格式输出
            System.out.println("title:" + searchHit.getSource().get("title"));//取文档的属性,是一个map
        }
    
        //4、释放资源
        client.close();
    
    }
    

    --5.2关键词查询

    @Test
    public void testTermQuery() throws Exception{
        //1、创建es客户端连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-elasticsearch").build();
        TransportClient client = new PreBuiltTransportClient(settings)
            .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
    
        //2、设置搜索条件
    
        //参数1:要搜索的字段
        //参数2:要搜索的关键词
        QueryBuilder queryBuilder = QueryBuilder = QueryBuilder.termQuery("title","北方")
        SearchResponse searchResponse = client.prepareSearch("blog2")
            .setTypes("article")
            .setQuery(queryBuilder).get();
        //3、遍历搜索结果数据
        SearchHits hits = searchResponse.getHits(); // 获取命中次数,查询结果有多少对象
        System.out.println("查询结果有:" + hits.getTotalHits() + "条");
        Iterator<SearchHit> iterator = hits.iterator();
        while (iterator.hasNext()) {
            SearchHit searchHit = iterator.next(); // 每个查询对象
            System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
            System.out.println("title:" + searchHit.getSource().get("title"));
        }
    
        //4、释放资源
        client.close();
    
    }
    

    --5.3字符串查询

    @Test
    public void testStringQuery() throws Exception{
        //1、创建es客户端连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-elasticsearch").build();
        TransportClient client = new PreBuiltTransportClient(settings)
            .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
    
        //2、设置搜索条件
        //参数一:查询的内容
        //参数二:默认的搜索域,如果不指定将会在所有的域上面查询
        QueryBuilder queryBuilder = QueryBuilder = QueryBuilder.queryStringQuery("速度与激情").defaultField("title")
        SearchResponse searchResponse = client.prepareSearch("blog2")
            .setTypes("article")
            .setQuery(QueryBuilders.queryStringQuery("搜索")).get();
    
        //3、遍历搜索结果数据
        SearchHits hits = searchResponse.getHits(); // 获取命中次数,查询结果有多少对象
        System.out.println("查询结果有:" + hits.getTotalHits() + "条");
        Iterator<SearchHit> iterator = hits.iterator();
        while (iterator.hasNext()) {
            SearchHit searchHit = iterator.next(); // 每个查询对象
            System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
            System.out.println("title:" + searchHit.getSource().get("title"));
        }
    
        //4、释放资源
        client.close();
    
    }
    

    可以将上述的查询方法封装起来,然后传入查询条件searchBuilder即可

    6.查询文档分页操作

    6.1批量插入数据

    在QueryBuilder对象中,设置分页信息。然后再执行查询

    • 首先插入100条数据
     @Test
    //批量插入100条数据
    public void test9() throws Exception{
        	// 创建Client连接对象
            Settings settings = Settings.builder().put("cluster.name", "my-elasticsearch").build();
            TransportClient client = new PreBuiltTransportClient(settings)
                    .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
    
            ObjectMapper objectMapper = new ObjectMapper();
    
            for (int i = 1; i <= 100; i++) {
                // 描述json 数据
                Article article = new Article();
                article.setId(i);
                article.setTitle(i + "搜索工作其实很快乐");
                article.setContent(i
                        + "我们希望我们的搜索解决方案要快,我们希望有一个零配置和一个完全免费的搜索模式,我们希望能够简单地使用JSON通过HTTP的索引数据,我们希望我们的搜索服务器始终可用,我们希望能够一台开始并扩展到数百,我们要实时搜索,我们要简单的多租户,我们希望建立一个云的解决方案。Elasticsearch旨在解决所有这些问题和更多的问题。");
    
                // 建立文档
                client.prepareIndex("blog2", "article", article.getId().toString())
                        //.setSource(objectMapper.writeValueAsString(article)).get();
                        .setSource(objectMapper.writeValueAsString(article).getBytes(),XContentType.JSON).get();
            }
    
            //释放资源
            client.close();
    }
    

    分页处理

    @Test
    //分页查询
    public void test10() throws Exception{
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-elasticsearch").build();
        TransportClient client = new PreBuiltTransportClient(settings)
            .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
    
        // 搜索数据
       /* SearchRequestBuilder searchRequestBuilder = client.prepareSearch("blog2").setTypes("article")
            .setQuery(QueryBuilders.matchAllQuery());//默认每页10条记录
    
        // 查询第2页数据,每页20条
        //setFrom():从第几条开始检索,默认是0。
        //setSize():每页最多显示的记录数。
        searchRequestBuilder.setFrom(0).setSize(5);
        SearchResponse searchResponse = searchRequestBuilder.get();
    
        SearchResponse searchResponse = client.prepareSearch("")   
        */
        SearchResponse searchResponse = client.prepareSearch("index_hello")
                  .setType("article")
                  .setQuery(queryBuilder)
                  //设置起始位置
                  .setFrom(0)
                  //每页显示的行数
                  .setSize(5)
                  .get()
        
         
    
        SearchHits hits = searchResponse.getHits(); // 获取命中次数,查询结果有多少对象
        System.out.println("查询结果有:" + hits.getTotalHits() + "条");
        Iterator<SearchHit> iterator = hits.iterator();
        while (iterator.hasNext()) {
            SearchHit searchHit = iterator.next(); // 每个查询对象
            System.out.println(searchHit.getSourceAsString()); // 获取字符串格式打印
            System.out.println("id:" + searchHit.getSource().get("id"));
            System.out.println("title:" + searchHit.getSource().get("title"));
            System.out.println("content:" + searchHit.getSource().get("content"));
            System.out.println("-----------------------------------------");
        }
    
        //释放资源
        client.close();
    }
    

    7.查询结果高亮操作

    (1)高亮的配置

    • 配置高亮显示的字段
    • 设置高亮显示的前缀
    • 设置高亮显示的后缀
      (2)在client对象执行查询之前,设置高亮显示的信息
      (3)遍历结果列表时可以从结果中取高亮结果

    7.1什么是高亮显示

    在进行关键字搜索时,搜索出的内容中的关键字会显示不同的颜色,称之为高亮
    百度搜索关键字"传智播客"

    7.2高亮显示的html分析

    ElasticSearch可以对查询出的内容中关键字部分进行标签和样式的设置,但是你需要告诉ElasticSearch使用什么标
    签对高亮关键字进行包裹

    7.3高亮显示代码实现

    @Test
    //高亮查询
    public void test11() throws Exception{
        // 创建Client连接对象
        Settings settings = Settings.builder().put("cluster.name", "my-elasticsearch").build();
        TransportClient client = new PreBuiltTransportClient(settings)
            .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("127.0.0.1"), 9300));
    
        // 搜索数据
        SearchRequestBuilder searchRequestBuilder = client
            .prepareSearch("blog2").setTypes("article")
            .setQuery(QueryBuilders.termQuery("title", "搜索"));
    
        //设置高亮数据
        HighlightBuilder hiBuilder=new HighlightBuilder();
        hiBuilder.preTags("<font style='color:red'>");
        hiBuilder.postTags("</font>");
        hiBuilder.field("title");
        searchRequestBuilder.highlighter(hiBuilder);
    
        //获得查询结果数据
        SearchResponse searchResponse = searchRequestBuilder.get();
    
        //获取查询结果集
        SearchHits searchHits = searchResponse.getHits();
        System.out.println("共搜到:"+searchHits.getTotalHits()+"条结果!");
        //遍历结果
        for(SearchHit hit:searchHits){
            System.out.println("String方式打印文档搜索内容:");
            System.out.println(hit.getSourceAsString());
            System.out.println("Map方式打印高亮内容");
            System.out.println(hit.getHighlightFields());
    
            System.out.println("遍历高亮集合,打印高亮片段:");
            Text[] text = hit.getHighlightFields().get("title").getFragments();
            for (Text str : text) {
                System.out.println(str);
            }
        }
    
        //释放资源
        client.close();
    }
    

  • 相关阅读:
    thinkpa R61i安装XP SATA的解决方法
    成都港宏4S店买的日产,送的无牌DVD 和可视倒车品牌是路特仕 80007
    设计模式之:解剖观察者模式
    java使用siger 获取服务器硬件信息(CPU 内存 网络 io等)
    lephone 壁纸(裸婚时代 童佳倩姚笛壁纸)
    C# 让程序自动以管理员身份运行
    项目管理的5大过程组、9大知识域、44个管理流程的映射关系
    Spring Security 中如何让用户名不存在的错误显示出来(用户名不存在显示Bad credentials)
    eclipse老是报ThreadPoolExecutor$Worker.run()
    Unison文件夹同步工具
  • 原文地址:https://www.cnblogs.com/psyduck/p/14466510.html
Copyright © 2011-2022 走看看