spark-shell中可以直接编写SQL语句从数据源中加载数据。
可以利用scala语言中的多行字符串(三个引号)让SQL语句结构清晰更易于阅读。
示例:
sqlContext.sql("""
SELECT user_no,oper_code
FROM cui.operation_data_android
WHERE user_no <> 'null' AND oper_time>='20160101000000' AND oper_time<'20160114000000'
""").take(1)
效果:
