zoukankan html css js c++ java

spark写入ES(动态模板）

使用es-hadoop插件，主要使用elasticsearch-spark-20_2.11-6.2.x.jar

官网：https://www.elastic.co/guide/en/elasticsearch/hadoop/current/reference.html

关于ES详细的配置参数大家可以看下面的这个类：

org.elasticsearch.hadoop.cfg.ConfigurationOptions

sparkstreaming写入ES:

        SparkConf conf = new SparkConf();
        conf.set("es.index.auto.create", "true");
        conf.set("es.nodes", "10.8.18.16,10.8.18.45,10.8.18.76");
        conf.set("es.port", "9200");
        JavaStreamingContext ssc= null;
        try {
            ssc= new JavaStreamingContext(conf, new Duration(5000L));
            JavaSparkContext jsc =ssc.sparkContext();                        
            String json1 = "{"reason" : "business","airport" : "sfo"}";  
            String json2 = "{"participants" : 5,"airport" : "otp"}";

            JavaRDD<String> stringRDD = jsc.parallelize(ImmutableList.of(json1, json2));
            Queue<JavaRDD<String>> microbatches = new LinkedList<JavaRDD<String>>();      
            microbatches.add(stringRDD);
            JavaDStream<String> stringDStream = ssc.queueStream(microbatches);
            
            //接口1：es的配置通过SparkConf配置
            //使用动态模板，用{}将动态生成的字段名括起来，注意是作用于index
            //而不是type
            //JavaEsSparkStreaming.saveJsonToEs(stringDStream, "spark-{airport}/doc");
            
            Map<String,String> map = new HashMap<String,String>();
            map.put("es.index.auto.create", "true");
            map.put("es.nodes", "ip1,ip2,ip3");
            map.put("es.resource.write", "spark-{airport}/doc");
            map.put("es.port", "9200");
            //接口2：es的配置通过HashMap配置，其中读取es是index的key为es.resource.read
            //写入的key为es.resource.write
            //JavaEsSparkStreaming.saveJsonToEs(stringDStream, map);
            //接口3：与接口2类似，只是该接口支持直接填写index参数
            JavaEsSparkStreaming.saveJsonToEs(stringDStream,"spark-{airport}/doc", map);
            ssc.start();
            ssc.awaitTermination();
        } catch (Throwable e) {
            // TODO 自动生成的 catch 块
            ssc.close();
            e.printStackTrace();
        }

//使用动态模板，用{}将动态生成的字段名括起来，注意是作用于index

查看全文

相关阅读:
刚刚开通
 腾讯面试经历2015
排序之归并排序
 AC自动机
 后缀数组初步
 概率dp初探
 【NOIP2015】反思+题解
 Built-in functions
poj2528 Mayor's posters(线段树区间覆盖)
Codeforces #317 C.Lengthening Sticks(数学)

原文地址：https://www.cnblogs.com/lyy-blog/p/9728001.html