zoukankan html css js c++ java

spark sql 访问mysql数据库

pom.xml

<dependency>
    <groupId>mysql</groupId>
    <artifactId>mysql-connector-java</artifactId>
    <version>5.1.47</version>
</dependency>

<dependency>
    <groupId>org.scala-lang</groupId>
    <artifactId>scala-xml</artifactId>
    <version>2.11.0-M4</version>
</dependency>

<dependency>
    <groupId>org.scala-lang</groupId>
    <artifactId>scala-library</artifactId>
    <version>${scala.version}</version>
</dependency>

<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-core_2.11</artifactId>
    <version>${spark.version}</version>
</dependency>

<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-sql_2.11</artifactId>
    <version>${spark.version}</version>
</dependency>

<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-client</artifactId>
    <version>2.6.0</version>
</dependency>


scala代码

val spark = new SparkSession.Builder()
  .master("local[6]")
  .appName("kuduhomework")
  .getOrCreate()

//设置日志级别

spark.sparkContext.setLogLevel("WARN")

import spark.implicits._

val df = spark.read
  .format("jdbc")
  .option("url", "jdbc:mysql://192.168.100.100:3306/test")
  .option("dbtable", "person")
  .option("user", "root")
  .option("password", "123456")
  .load()

//DataFrame数据成映射person表

df.createOrReplaceTempView("person")

//使用sql语句操作数据

spark.sql("select * from person")
     .show()

sparksql 是spark支持sql操作的API。
用于处理结构化数据，获取数据的schema信息，像表一样使用sql操作数据。

查看全文

相关阅读:
Python开发之路
 openstack系列阅读目录
 linux基础
 PEP8规范
 我真的还是18岁的那个我
 为什么很多IT公司不喜欢进过培训机构的人呢？
GRE与VXLAN
VLAN模式
 网络虚拟化基础一：linux名称空间Namespaces
四：OVS+GRE之网络节点

原文地址：https://www.cnblogs.com/chong-zuo3322/p/11977988.html