zoukankan html css js c++ java

Spark Streaming的wordcount案例

之前测试的一些spark案例都是采用离线处理，spark streaming的流处理一样可以运行经典的wordcount。

基本环境：

spark-2.0.0

scala-2.11.0

IDEA-15.0.6

创建项目，贴上代码：

package org.iie

import org.apache.log4j.{Level,Logger}
import org.apache.spark.storage.StorageLevel
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Minutes, Seconds, StreamingContext}

/**
  * Created by hbwxcw on 2016/12/9.
  */
object NetworkWordCount {
  def main(args: Array[String]) {
    import org.apache.log4j.{Level,Logger}
    Logger.getLogger("org.apache.spark").setLevel(Level.WARN)
    Logger.getLogger("org.apache.spark.sql").setLevel(Level.WARN)
    Logger.getLogger("org.apache.spark.streaming").setLevel(Level.WARN)

    val sparkConf = new SparkConf().setAppName("nwc")
    val ssc = new StreamingContext(sparkConf,Seconds(1))
    val lines = ssc.socketTextStream(args(0),args(1).toInt,StorageLevel.MEMORY_AND_DISK_SER)
    val words = lines.flatMap(_.split(" "))
    val wordCounts = words.map(x => (x,1)).reduceByKey(_+_)
    wordCounts.print()
    
    ssc.start()
    ssc.awaitTermination()
  }
}

记得在pom.xml下引入依赖：

    <dependency>
      <groupId>org.apache.spark</groupId>
      <artifactId>spark-core_2.11</artifactId>
      <version>2.0.0</version>
    </dependency>
    <dependency>
      <groupId>org.apache.spark</groupId>
      <artifactId>spark-streaming_2.11</artifactId>
      <version>2.0.0</version>
    </dependency>

再生成jar包传到集群上，用spark-submit进行提交。

但是得注意后面得加上主机名和端口号。。

你就会看到下面这个家伙= =。

表示上面那个ERROR对结果没什么影响啊，不管它= =。。

再在另外一个窗口运行：

nc -l -p 9999

我用的是9999端口。。你们随意。。。

网上好多博客都用的是nc -lk 9999，反正我是没用，疑似版本问题。。。

顺便贴一下结果：

在一端用nc输入：o o a a ss s aa aa

另外一端出现：

查看全文

相关阅读:
多状态场景：后端只记录行为，不记录行为的含义，比如产品定义的状态值含义；行为是客观的，不变的。
Golang协程池的使用原创 360质量效能 360质量效能 2021-05-28
&strct new
【Golang】图解函数调用栈
 Mybatis-Plus的应用场景及注入SQL原理分析
 倒计时时间到触发事件
 浅析软件供应链攻击之包抢注低成本钓鱼
 腾讯代码安全指南开源，涉及C/C++、Go等六门编程语言 https://mp.weixin.qq.com/s/yzg5uVnoJDTyaH2Wn8Vo7w
58黄页标签提取及海量多分类优化
 引用站点策略: strict-origin-when-cross-origin 引用站点策略: no-referrer-when-downgrade

原文地址：https://www.cnblogs.com/hbwxcw/p/6149972.html