zoukankan      html  css  js  c++  java
  • python spark

    1: spark使用python3

     pip3 install py4j (服务器和本机都要安装)

    •  服务器提交python3脚本
    export PYSPARK_PYTHON=python3
     ./spark-submit /root/bigdata/app.py
    • 本机调试python脚本
    1.      在pycharm中建立python3程序,点击run->edit configuration

                   Environment variables,点击后面的编辑框,在变量栏目中依次添加PYTHONPATH,值为spark目录/python,SPARK_HOMR,值为spark安装目录,点ok退出。

         2.       修改spark python版本

                   在每段python脚本前加这个

    import os
    os.environ["PYSPARK_PYTHON"]="python3"

    2.脚本提交

    cd 到bin目录下
    
    ./spark-submit --master spark://ip:7077  code.py
  • 相关阅读:
    Mark
    linux重启mysql无法启动
    网络流量监测IP雷达 4.0
    BBR拥塞控制算法
    弱口令
    SSH加固
    Openstack 部署
    Integrate Neutron and OVN
    Build OpenVSwitch and OVN
    OVN 简单组网脚本
  • 原文地址:https://www.cnblogs.com/zhangweilun/p/6533933.html
Copyright © 2011-2022 走看看