Windows7下安装pyspark

zoukankan html css js c++ java

Windows7下安装pyspark
安装需要如下东西：

java

jdk-8u181-windows-x64.exe

spark

spark-2.1.3-bin-hadoop2.7

hadoop(版本要与spark的一致，这里都是hadoop2.7)

hadoop-2.7.7

Anaconda(这个是为了预防python出现api-ms-win-crt-runtime-l1-1-0.dll错误，且安装了vc_redist.2015.exe还无法解决时需要安装)

Anaconda3-2.4.1-Windows-x86_64.exe

python

python-3.5.4-amd64.exe

pycharm

pycharm-community-2016.1.4.exe

安装JDK

千万不要用默认路径Program Files，这个有空格后面会很坑！新建路径在C:Java，Java安装在这里！
新建环境变量名：JAVA_HOME，变量值：C:Javajdk1.8.0_11

打开PATH，添加变量值：%JAVA_HOME%in;%JAVA_HOME%jrein

新建环境变量名：CLASSPATH，变量值：.;%JAVA_HOME%libdt.jar;%JAVA_HOME%lib ools.jar
在 cmd 中输入 java 出现如下信息就算安装成功了

安装spark

在C盘新建Spark目录，将其解压到这个路径下
新建环境变量名：SPARK_HOME，变量值：C:Spark

打开PATH，添加变量值：%SPARK_HOME%in
安装hadoop

在C盘新建Hadoop目录，将其解压到这个路径下
新建环境变量名：HADOOP_HOME，变量值：C:Hadoop

打开PATH，添加变量值：%HADOOP_HOME%in
去网站下载Hadoop在Windows下的支持winutils

https://github.com/steveloughran/winutils

根据版本来选择，这里用的是 hadoop2.7，所以选择2.7的bin下载下来，将其覆盖到 C:Hadoopin

修改C:Hadoopetchadoop下的hadoop-env.cmd为set JAVA_HOME=C:Javajdk1.8.0_11

在 cmd 中输入 hadoop 出现如下信息就算安装成功了

安装python

安装路径为 C:Python35

在C盘或者代码盘新建 mphive路径，输入命令
```
winutils.exe chmod -R 777 C:	mphive
```
验证pyspark

cmd输入pyspark得到如下画面

配置pycharm

在如下路径添加环境变量
JAVA_HOME

SPARK_HOME

HADOOP_HOME
```
Run->Edit Configurations->Environment variables
```
查看全文

相关阅读:
与非
 抄卡组
 数据结构》关于差分约束的两三事（BZOJ2330）
刷题向》图论》BZOJ1179 关于tarjan和SPFA的15秒(normal)
图论算法》关于tarjan算法两三事
 图论算法》关于SPFA和Dijkstra算法的两三事
 刷题向》DP》值得一做》关于对DP问题的充分考虑(normal)
数据结构》关于线段树两三事（新手向）（工具向）
图论算法》关于匈牙利算法的两三事
 关于羊和车的问题

原文地址：https://www.cnblogs.com/TTyb/p/9717499.html

Windows7下安装pyspark

java

spark

hadoop(版本要与spark的一致，这里都是hadoop2.7)

Anaconda(这个是为了预防python出现api-ms-win-crt-runtime-l1-1-0.dll错误，且安装了vc_redist.2015.exe还无法解决时需要安装)

python

pycharm

安装JDK

安装spark

安装hadoop

安装python

验证pyspark

配置pycharm