zoukankan      html  css  js  c++  java
  • spark(4)

    SparkSQL

    -----------------------------

      该模块能在spark上运行sql语句

      DataFrame      //数据框,相当于mysql中的表

      使用类似SQL的方式来访问hadoop,实现MR计算。RDD

      df = sc.createDataFrame(rdd);

      DataSet<Row> ==DataFrame===>//类似于table操作

    SparkSQL java

    ---------------------------------------------

    package com.it18zhang.scalaDemo;
    
    import org.apache.spark.SparkConf;
    
    /**json
     * Created by stone on 2018/9/28.
     */
    public class SQLJava {
        public static void main(String[] args){
            SparkConf conf = new SparkConf();
            conf.setMaster("local");
            conf.setAppName("SQLJava");
            SparkSession session = SparkSession.builder().appendName("SQLJava").config("master","local").getOrCreate();
            Dataset<Row> df = session.read().json("file:///d:/scala/json.dat");
            df.show();
        }
    }

    将DataFrame转换成RDD的操作

    --------------------------------------------------------------

        JavaRDD<Row> rdd = df1.toJavaRDD();

    保存spark的sql计算结果(json)

    ---------------------------------------------

      //保存成json文件。

      df.write().json(dir);

      //设置保存模式

      df.mode(SavaMode.APPEND);

    json文件的读写

    ----------------------------------

      //读取json文件形成的df对象

      SparkSeesion.read().json("...");

      //将数据框数据写入json文件

      SparkSeesion.write().json("....");

    SparkDataFrame以jdbc方式操纵的表

    ---------------------------------------------------

      1.引入mysql驱动

      

  • 相关阅读:
    Laravel 中查询 where 记录
    eclipse svn重定位(relocate)
    使用git ftp发布我个人的hexo博客内容
    oracle数据库查询常用语句
    telnet关闭tomcat
    XML字符串解析成对象的时候应注意空格
    去除焦点边框线
    如何查看和更改mysql数据库文件存放位置
    设置div,td失去焦点
    (加减乘除)字符串计算机
  • 原文地址:https://www.cnblogs.com/bigdata-stone/p/9722167.html
Copyright © 2011-2022 走看看