zoukankan      html  css  js  c++  java
  • Scala创建SparkStreaming获取Kafka数据代码过程

    正文

      首先打开spark官网,找一个自己用版本我选的是1.6.3的,然后进入SparkStreaming   ,通过搜索这个位置找到Kafka,

      

        点击过去会找到一段Scala的代码    

         import org.apache.spark.streaming.kafka._
    
         val kafkaStream = KafkaUtils.createStream(streamingContext, 
           [ZK quorum], [consumer group id], [per-topic number of Kafka partitions to consume])

         如果想看createStream方法,可以值通过SparkStreaming中的 Where to go from here 中看到,有Java,Scala,Python的documents选择自己编码的一种点击进去。我这里用的Scala,点击KafkaUtils进去后会看到这个类中有很多的方法,其中我们要找的是createStream方法,看看有哪些重载。我们把这个方法的解释赋值过来。

        

      defcreateStream(jssc: JavaStreamingContextzkQuorum: String, groupId: String, topics: Map[String, Integer])JavaPairReceiverInputDStream[String, String]

           Create an input stream that pulls messages from Kafka Brokers. Storage level of the data will be the default StorageLevel.MEMORY_AND_DISK_SER_2.

           jssc

        JavaStreamingContext object

           zkQuorum

        Zookeeper quorum (hostname:port,hostname:port,..)

           groupId

        The group id for this consumer

           topics

        Map of (topic_name -> numPartitions) to consume. Each partition is consumed in its own thread

           returns

        DStream of (Kafka message key, Kafka message value)

        最后我们在IDEA中写Scala获取Kafka代码

        

      def main(args: Array[String]): Unit = {
         val spark = SparkSession.builder()
        .appName(Constants.SPARK_APP_NAME_PRODUCT)
        .getOrCreate()
         val map = Map("topic" -> 1)
         val ssc = new StreamingContext(spark.sparkContext, Seconds(5))
         val createStream: ReceiverInputDStream[(String, String)] = KafkaUtils.createStream(ssc, "hadoop01:9092,hadoop02:9092,hadoop03:9092", "groupId", map, StorageLevel.MEMORY_AND_DISK_SER)
         val map1: DStream[String] = createStream.map(_._2)

      }

      

        

         简答的代码过程,因为还有一些后续的工作要做,所以只是简单的写了一些从Kafa获取数据的代码从官网查找的一个过程,也是怀着学习的态度与大家一起交流,希望大牛们多多指点。

                i want to take you to travel ,this is my current mood

  • 相关阅读:
    调试技术 Orisun 博客园
    Core Dump和/proc调试 Orisun 博客园
    再谈select, iocp, epoll,kqueue及各种I/O复用机制 Shallway 博客频道 CSDN.NET
    基础很重要
    Speech and Language Processing (2nd Ed.): Updates
    CS 288: Statistical Natural Language Processing
    对C++中string类型的总结
    HTTP代理实现请求报文的拦截与篡改1 jivi 博客园
    学习优秀源码 Orisun 博客园
    分享:苹果老员工可享两年离岗留职待遇
  • 原文地址:https://www.cnblogs.com/hackerxiaoyon/p/7650015.html
Copyright © 2011-2022 走看看