zoukankan html css js c++ java

Spark JdbcRDD 简单使用

package org.apache.spark.sql.sources

import org.apache.spark.SparkContext
import java.sql.{ResultSet, DriverManager}
import org.apache.spark.rdd.JdbcRDD

/**
 * @author luogankun
 * Created by spark on 14-12-25.
 */
object JdbcTest extends  App{
    val sc = new SparkContext("local[2]", "demo")

    def getConnection() = {
      Class.forName("com.mysql.jdbc.Driver").newInstance()
      DriverManager.getConnection("jdbc:mysql://hadoop000:3306/hive", "root", "root")
    }

    def flatValue(result: ResultSet) = {
      (result.getInt("TBL_ID"), result.getString("TBL_NAME"))
    }

    //select * from TBLS WHERE TBL_ID>=1 AND TBL_ID<=10
    val data = new JdbcRDD(
      sc,
      getConnection,
      "select * from TBLS where TBL_ID >= ? and TBL_ID <= ?",
      1,
      10,
      2,
      flatValue
    )

    println(data.collect().toList)

    sc.stop
}

执行报错：

查看JdbcRDD代码发现，sql语句一定要带上2个条件：

这个使用起来不太方便，最近需要找时间将JdbcRDD优化下，以便后续更方便的在jdbc external data source中能使用JdbcRDD。

查看全文

相关阅读:
BootStrap2学习日记15----选项卡
 BootStrap2学习日记14----导航
 Google地图下载工具代码
 SqlServer 动态SQL（存储过程）中Like 传入参数无正确返回值的问题
 地球坐标-火星坐标-百度坐标及之间的转换算法 C#
GIS基础知识
 Gps坐标有效性判定
 Gps坐标距离计算C#实现
 C# 对字段忽略模型校验
 SQL基础复习2

原文地址：https://www.cnblogs.com/luogankun/p/4185186.html