zoukankan      html  css  js  c++  java
  • windows平台使用spark-submit以client方式提交spark应用到standalone集群

    1、spark应用打包,我喜欢打带依赖的,这样省事。

    2、使用spark-submit.bat 提交应用,代码如下:

    for /f "tokens=1,2 delims==" %%i in (config) do (set %%i=%%j)
    %sparkHome%/bin/spark-submit ^
    --class streaming.SocketStream ^
    --master spark://%masterIP%:7077 ^
    --executor-memory 4G ^
    --total-executor-cores 4 ^
    %projectHome%/targetspark-1.0-SNAPSHOT-jar-with-dependencies.jar
    

    第一行是读取配置,里面定义了一些变量,之后启动spark-submit.bat 脚本,--class指定main函数的类,路径是以classes为根目录的;master指定了master的服务端口,可以在master的UI里面看到;运行内存要比机器实际拥有的内存小,不然不够分配会报错;运行cpu核数同理;最后的spark应用jar包路径,由于是client模式,只需要在driver机器上能找到就行,我使用的是绝对路径,也可以使用hdfs的路径和file:///path这样的路径。

  • 相关阅读:
    打印出从1到最大的n位十进制数
    排序算法--(二)
    排序算法 (-)
    两个栈实现一个队列
    C++ 模板类解析
    根据先序遍历中序遍历重建二叉树
    格式化时间
    用js实现冒泡排序
    接口和抽象类的区别
    解析json
  • 原文地址:https://www.cnblogs.com/yuanyifei1/p/8439042.html
Copyright © 2011-2022 走看看