zoukankan      html  css  js  c++  java
  • spark(4)

    SparkSQL

    -----------------------------

      该模块能在spark上运行sql语句

      DataFrame      //数据框,相当于mysql中的表

      使用类似SQL的方式来访问hadoop,实现MR计算。RDD

      df = sc.createDataFrame(rdd);

      DataSet<Row> ==DataFrame===>//类似于table操作

    SparkSQL java

    ---------------------------------------------

    package com.it18zhang.scalaDemo;
    
    import org.apache.spark.SparkConf;
    
    /**json
     * Created by stone on 2018/9/28.
     */
    public class SQLJava {
        public static void main(String[] args){
            SparkConf conf = new SparkConf();
            conf.setMaster("local");
            conf.setAppName("SQLJava");
            SparkSession session = SparkSession.builder().appendName("SQLJava").config("master","local").getOrCreate();
            Dataset<Row> df = session.read().json("file:///d:/scala/json.dat");
            df.show();
        }
    }

    将DataFrame转换成RDD的操作

    --------------------------------------------------------------

        JavaRDD<Row> rdd = df1.toJavaRDD();

    保存spark的sql计算结果(json)

    ---------------------------------------------

      //保存成json文件。

      df.write().json(dir);

      //设置保存模式

      df.mode(SavaMode.APPEND);

    json文件的读写

    ----------------------------------

      //读取json文件形成的df对象

      SparkSeesion.read().json("...");

      //将数据框数据写入json文件

      SparkSeesion.write().json("....");

    SparkDataFrame以jdbc方式操纵的表

    ---------------------------------------------------

      1.引入mysql驱动

      

  • 相关阅读:
    【FIRST USE】第一次用git把代码上传到github
    [多线程学习笔记] 一个线程安全的队列
    C中宏展开问题
    C语言中的命名空间
    c语言中赋值语句的结果
    Python一些难以察觉的错误
    C语言中的内存压缩技术
    简述数据结构:二叉查找树
    指针与指针的引用、指针的指针
    C++ 中的virtual关键词
  • 原文地址:https://www.cnblogs.com/bigdata-stone/p/9722167.html
Copyright © 2011-2022 走看看