zoukankan      html  css  js  c++  java
  • 寒假学习第十三天

    使用 netcat 数据源测试 Flume
    请对 Flume 的相关配置文件进行设置,从而可以实现如下功能:在一个 Linux 终端(这
    里称为“Flume 终端”)中,启动 Flume,在另一个终端(这里称为“Telnet 终端”)中,
    输入命令“telnet localhost 44444”,然后,在 Telnet 终端中输入任何字符,让这些字符可以
    顺利地在 Flume 终端中显示出来。
    mport sys
    from pyspark import SparkContext
    
    from pyspark.streaming import StreamingContext
    
    from pyspark.streaming.flume import FlumeUtils
    
    import pyspark
    if __name__ == "__main__":
    
        if len(sys.argv) != 3:
    
            print("Usage: flume_wordcount.py <hostname> <port>", file=sys.stderr)
    
            exit(-1)
    
    
    
        sc = SparkContext(appName="FlumeEventCount")
    
        ssc = StreamingContext(sc, 2)
        hostname = sys.argv[1]
    
        port = int(sys.argv[2])
    
        stream = FlumeUtils.createStream(ssc, hostname, port, pyspark.StorageLevel.MEMORY_AND_DISK_SER_2)
    
        stream.count().map(lambda cnt: "Recieve " + str(cnt) + " Flume events!!!!").pprint()
    
        ssc.start()
    
        ssc.awaitTermination()

    启动spark

    技术图片

    运行flume

    技术图片

    启动Telnet

    技术图片

  • 相关阅读:
    IO基础
    集合框架
    数据结构基础
    进程和线程
    matlab绘制三维图形
    matlab figure 窗口最大化
    Matlab中的fread函数
    matlab中fopen 和 fprintf函数总结
    matlab中findstr,strfind,strcmp,strncmp区别与联系
    matlab取消和添加注释以及一些快捷键
  • 原文地址:https://www.cnblogs.com/lishengming00/p/12304169.html
Copyright © 2011-2022 走看看