SparkSQL编程需注意的细节 - 走看看

zoukankan html css js c++ java

SparkSQL编程需注意的细节
- SparkSQL是把Hive转为字符串后，以参数形式传递到SparkSession.builder().enableHiveSupport().getOrcCreate().sql(Hive_String)中执行。
  例子
```
SparkSession spark = SparkSession.builder().enableHiveSupport().getOrcCreate();
String sql = “ALTER TABLE DB_NAME.TABLE1 DROP IF EXISTS PARTITION(pt_dt=')"+ partition_date +"')";
```
- SparkSQL中，分区名、分区字段需小写。
  如上面例子中的pt_dt 分区名为小写，若写成PT_DT,则会报错。
  同时，SELECT 分区字段时也需小写。
  例如
```
String sql = "SELECT ID, "
+"       NAME, "
+"       pt_dt "
+" FROM DB_NAME.TABLE1 "
+" WHERE pt_dt = '" + partition_date + "'"
```
- 对传入参数要做判空处理
  例如
```
if(versionNum==null || versionNum.isEmpty() || "none".equals(versionNum)) {
	versionNum = "";
}
```
- 字符串拼接时，注意空格问题
  若sql转为字符串没注意行首和行末的空格，可能出现sql解析时出现“粘连”现象。
  例如
```
String sql = "SELECT ID,"
+"       NAME, "
+"       pt_dt"
+"FROM DB_NAME.TABLE1 "
+" WHERE pt_dt = '" + partition_date + "'"
```
其中，字段pt_dt后没有空格，FROM前也没有空格，sql解析出来会变成pt_dtFROM，造成语法错误。
查看全文

相关阅读:
python爬虫----XPath
定时爬取海丝财经网站新闻内容
 传染病传播模型（SIS）Matlab代码
 李航统计学习方法——算法3朴素贝叶斯法
 李航统计学习方法——算法2k近邻法
 文件从开头删除几个字符，整个磁盘的变化
 intel DSA spec 解读
 线上上课=大屏电视显示+nuc做机顶盒+手机做移动麦克风
 VPP/UPF/GTP
超标量

原文地址：https://www.cnblogs.com/JasonCeng/p/12217754.html

Copyright © 2011-2022 走看看