zoukankan      html  css  js  c++  java
  • 学习进度笔记

    学习进度笔记24

    读取文件演示

    import org.apache.spark.SparkConf

    import org.apache.spark.streaming.{Seconds, StreamingContext}

    import org.apache.spark.streaming.StreamingContext._

    object FileWordCount {

      def main(args: Array[String]) {

        val sparkConf = new SparkConf().setAppName("FileWordCount").setMaster("local[2]")

        // 创建Streaming的上下文,包括Spark的配置和时间间隔,这里时间为间隔20秒

        val ssc = new StreamingContext(sparkConf, Seconds(20))

        // 指定监控的目录,在这里为/home/hadoop/temp/

        val lines = ssc.textFileStream("/home/hadoop/temp/")

        // 对指定文件夹变化的数据进行单词统计并且打印

        val words = lines.flatMap(_.split(" "))

        val wordCounts = words.map(x => (x, 1)).reduceByKey(_ + _)

        wordCounts.print()

           // 启动Streaming

        ssc.start()

        ssc.awaitTermination()

      }

    }

  • 相关阅读:
    java--堆栈
    git 修改默认编辑器
    java 二维数组的行列长度
    公钥私钥
    手机是如何定位的
    Git和svn的区别
    面试未解之谜
    删除单链表中重复元素
    深入分析事务的隔离级别
    传送
  • 原文地址:https://www.cnblogs.com/xueqiuxiang/p/14467003.html
Copyright © 2011-2022 走看看