windwos部署hadoop伪分布式环境

zoukankan html css js c++ java

windwos部署hadoop伪分布式环境

1.官网下载hadoop安装包

下载地址：https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz

下载后解压到本地文件夹。

2.配置hadoop环境变量

3.修改配置文件

3.1 hdfs-site.xml文件配置

<configuration>

<property>
<name>dfs.replication</name>
<value>1</value>
</property>

<property>
<name>dfs.namenode.name.dir</name>
<value>file:///D://soft//hadoop//hadoop-2.10.1//dfs</value>
</property>
</configuration>

3.2 core-site.xml文件配置

<configuration>

<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>


<property>
<name>hadoop.tmp.dir</name>
<value>D://soft//hadoop//hadoop-2.10.1//tmp</value>
</property>
</configuration>

4.执行命令 hadoop namenode -format

执行后报错--原因已经列出需要设置JAVA-HOME

配置后依旧报错。原因是路径中包含空无法通过。java安装在无空格目录下即可。或者安装在Program Files 的同学可以配置为

C:PROGRA~1Javajdk1.8.0_261。配置后问题解决。无报错信息即为通过。

5.启动hadoop

执行 start-all 命令。

查看日志发现启动失败

原因是缺少文件。

解决方案 -去github上下载对应文件放在对应目录。https://github.com/cdarlint/winutils

重新执行start-all后。依旧报错。。。。。

还需要copy hadoop.dll至 bin目录下。如不行在C://windows/System32 目录也添加文件 hadoop.dll。

启动后会有四个dos窗口。至此hadoop启动成功。

6.查看web管理页面

http://localhost:50070/ -hdfs页面

http://localhost:8088/ -yarn任务页面

7.执行mapReduce任务。

1. 新建txt文件

2.上传至hdfs

1.建立test目录

hadoop fs -mkdir /test

2. 上传文件

hadoop fs -put C:UsersGLNC-taowenchenDesktop11.txt /test/11.txt

3.执行wordcount

hadoop jar D:softhadoophadoop-2.10.1sharehadoopmapreducehadoop-mapreduce-examples-2.10.1.jar wordcount /test /result

执行成功后。在web管理页面可以看到已经输出结果文件了

可是在yarn任务管理页面无法查看到任务。

原因是以上job是以本地模式启动的（通过jobId可以区别。jobId中带了local关键字）。在yarn管理页面无法查看。

8.继续修改配置，在yarn上运行MapReduce Job。

1.yarn-site.xml配置

<configuration>


<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>


<property>
<name>yarn.resourcemanager.hostname</name>
<value>localhost</value>
</property>
</configuration>

2.配置mapred-site.xml

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

3.重启hadoop，在执行wordcount MapReduce Job .可以在yarn 管理页面查看任务记录。

查看全文

相关阅读:
在线工具TOOL收藏
 HtmlDocument [代码碎片笔记]
ChromiumWebBrowser [链接]
PHP [开发汇总]
Discuz[技术文献]
[jvm] -- 监控和调优常用命令工具篇
 [jvm] -- 常用内存参数配置篇
 [日常摘要] -- 事务的隔离级别篇
 [日常摘要] -- ThreadLocal篇
 [日常摘要] -- zookeeper篇

原文地址：https://www.cnblogs.com/liwc/p/14031549.html

windwos部署hadoop伪分布式环境

1.官网下载hadoop安装包

2.配置hadoop环境变量

3.修改配置文件

3.1 hdfs-site.xml文件配置

3.2 core-site.xml文件配置

4.执行命令 hadoop namenode -format

5.启动hadoop

6.查看web管理页面

7.执行mapReduce任务。

1. 新建txt文件

2.上传至hdfs

1.建立test目录

2. 上传文件

3.执行wordcount

8.继续修改配置，在yarn上运行MapReduce Job。

1.yarn-site.xml配置

2.配置mapred-site.xml