zoukankan      html  css  js  c++  java
  • spark 数据流输出

    1、save to  hdfs json file

    spark.sparkContext.setLogLevel("error")
    val data=spark.read.json("hdfs://cslcdip/home/dip/lzm/sparkdata/people.json")
    data.write.mode("overwrite").json("hdfs://cslcdip/home/dip/lzm/sparkdata/result")

    • SaveMode指定文件保存时的模式。

    Overwrite:覆盖

    Append:追加

    ErrorIfExists:如果存在就报错

    Ignore:如果存在就忽略

     2、save to hdfs parquest

    val spark:SparkSession=sparkBuilder.master("local[2]").enableHiveSupport().getOrCreate()
        spark.sparkContext.setLogLevel("error")
        val  data=spark.read.json("hdfs://cslcdip/home/dip/lzm/sparkdata/people.json")
        data.write.mode("overwrite").parquet("hdfs://cslcdip/home/dip/lzm/sparkdata/result")
        val data2=spark.read.parquet("hdfs://cslcdip/home/dip/lzm/sparkdata/result/*")
        data2.show()

    3、save to mysql

    4、save to hive

      spark.sql("use bd")
      spark.sql("insert overwrite table b_province_center select * from tiger.b_province_center ")
  • 相关阅读:
    网络配置
    yum源配置
    linux压缩命令
    linux下创建和删除软、硬链接
    linux挂载光盘
    Linux-chmod_命令的详细用法讲解
    linux_rpm命令
    Linux_Vi_命令
    anglarJs前端控制器的继承
    angularJs分层服务开发
  • 原文地址:https://www.cnblogs.com/students/p/14274021.html
Copyright © 2011-2022 走看看