zoukankan html css js c++ java

python环境下使用pyspark读取hive表

python环境导入pyspark.sql

1.linux系统下,spark读取hive表

配置文件：
先将hive-site.xml放入linux spark内的conf内  //hive和linux下的spark连接
将jar包 mysql-connector-java.jar放入linux spark内的jars

　　如图：

2.在windows系统内，配置spark

配置文件：
将linux内的spark/conf文件替换掉windows下的conf文件，hive-site.xml内的ip根据自己实际情况改动
将mysql-connector-java.jar拷入windows 下spark/jars内

3.PyChrome下测试

方式一：配置环境变量自动读取

spark = SparkSession.builder.master("local[*]")
    .appName("test").enableHiveSupport().getOrCreate()
read_df=spark.sql("select * from dm_events.dm_usereventfinal limit 1")
read_df.show()

方式二：不需配置环境变量

 spark = SparkSession.builder.master("spark://192.168.142.197:7077") 
         .config("hive.metastore.uris","thrift://192.168.142.197:9083")
         .appName("test").enableHiveSupport().getOrCreate()
 read_df = spark.sql("select * from dm_events.dm_usereventfinal limit 1")
 read_df.show()

　注：也可以尝试直接DOS内尝试

>>pyspark
>>spark.sql("sql_sentence").show()

查看全文

相关阅读:
VC++6.0调用外部dll
VC++6.0配置Opencv
Qt 解决中文乱码问题
 Qt Widget控件设置布局后，内部控件大小发生变化
 QtDesigner 控件自适应窗体的方法
 QtSoap调用WebService服务
 QLabel自定义类实现点击效果以及鼠标掠过字体的颜色变化效果
 VS2017中工具箱控件是灰色（不可用）解决方法
 OpenCV(3.4.1) Error: Assertion failed (size.width>0 && size.height>0) in cv::imshow, file C:uildmaster_winpack-build-win64-vc15opencvmoduleshighguisrcwindow.cpp, line 356
OpenCV之错误集锦-1

原文地址：https://www.cnblogs.com/afeiiii/p/14183379.html