hadoop伪分布式之启动HDFS并运行MR程序（WordCount）

zoukankan html css js c++ java

hadoop伪分布式之启动HDFS并运行MR程序（WordCount）
一、配置相关文件

在hadoop-2.9.2下etc/hadoop/core-site.xml中配置：
<configuration>  <property> <name>fs.defaultFS</name> <value>hdfs://hadoop01:9000</value> </property>  <property> <name>hadoop.tmp.dir</name> <value>/opt/module/hadoop-2.9.2/data/tmp</value> </property> </configuration>
hadoop01是当前主机名。

在hdfs-site.xml中配置
 <configuration> <name>dfs.replication</name> <value>1<value> </configuration>
配置hadoop-env.sh：
export JAVA_HOME=/opt/module/jdk1.8.0_11
二、启动集群

在hadoop-2.9.2目录下

（1）格式化NaneNode（第一次启动时要格式化，以后就不要总格式化）

bin/hdfs namenode -format

（2）启动NameNode

sbin/hadoop-daemon.sh start namenode

之后使用jps查看：

（3）启动DataNode

sbin/hadoop-daemon.sh start datanode

（3）关闭防火墙

systemctl status firewalld.service查看防火墙状态

systemctl stop firewalld.service 关闭运行的防火墙

然后在windows中就可以访问了：

进入到以下目录中：

在hadoop-2.9.2目录下输入：

bin/hdfs dfs -mkdir -p /user/gong/input

刷新浏览器中刚才的目录，就会出现：

我们上传一个数据上去：

bin/hdfs dfs -put wcinput/wc.input /user/gong/input

（4）执行一个实例WordCount

在hadoop-2.9.2目录下输入：

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.2.jar wordcount /user/gong/input /user/gong/output

然后在浏览器中就可以看到结果啦：

可以在Linux中运行bin/hdfs dfs -cat /user/gong/output/p* 查看
查看全文

相关阅读:
网页包抓取工具Fiddler工具简单设置
 django-Celery分布式队列简单使用
 django-nginx与uwsgi项目部署
 mysql数据库备份之主从同步配置
 mysql开启二进制日志
 python-django框架中使用七牛云
 python-django框架中使用FastDFS分布式文件系统
 python-django框架中使用docker和elasticsearch配合实现搜索功能
 C#_WPF中创建二维码、识别二维码
 读书笔记：《企业IT架构转型之道-阿里巴巴中台战略思想与架构实战》

原文地址：https://www.cnblogs.com/xiximayou/p/12389363.html