Hadoop 配置（2）-Hadoop伪分布式配置

zoukankan html css js c++ java

Hadoop 配置（2）-Hadoop伪分布式配置
Hadoop 可以在单节点上以伪分布式的方式运行，Hadoop 进程以分离的 Java 进程来运行，节点既作为 NameNode 也作为 DataNode，同时，读取的是 HDFS 中的文件。
Hadoop 的配置文件位于 /usr/local/hadoop/etc/hadoop/ 中，伪分布式需要修改2个配置文件 core-site.xml 和 hdfs-site.xml 。Hadoop的配置文件是 xml 格式，每个配置以声明 property 的 name 和 value 的方式来实现。
修改配置文件 core-site.xml (通过 gedit 编辑会比较方便: gedit ./etc/hadoop/core-site.xml)，将当中的
```
<configuration>
</configuration>
```
修改为下面配置：
```
<configuration>
        <property>
             <name>hadoop.tmp.dir</name>
             <value>file:/usr/local/hadoop/tmp</value>
             <description>Abase for other temporary directories.</description>
        </property>
        <property>
             <name>fs.defaultFS</name>
             <value>hdfs://localhost:9000</value>
        </property>
</configuration>
```
同样的，修改配置文件 hdfs-site.xml
```
<configuration>
        <property>
             <name>dfs.replication</name>
             <value>1</value>
        </property>
        <property>
             <name>dfs.namenode.name.dir</name>
             <value>file:/usr/local/hadoop/tmp/dfs/name</value>
        </property>
        <property>
             <name>dfs.datanode.data.dir</name>
             <value>file:/usr/local/hadoop/tmp/dfs/data</value>
        </property>
</configuration>
```
配置完成后，执行 NameNode 的格式化:
```
./bin/hdfs namenode -format
```
接着开启 NameNode 和 DataNode 守护进程。
```
./sbin/start-dfs.sh
```
找不到JAVA_HOME的错误需要设置./etc/hadoop/hadoop_env.sh，export JAVA_HOME设置一个绝对路径。
此处Warning 可忽略。
~/.bashrc 中，增加如下两行内容（设置过程与 JAVA_HOME 变量一样，其中 HADOOP_HOME 为 Hadoop 的安装目录）：
```
export HADOOP_HOME=/usr/local/hadoop
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
```
启动完成后，可以通过命令 jps 来判断是否成功启动，若成功启动则会列出如下进程: “NameNode”、”DataNode” 和 “SecondaryNameNode”
（如果 SecondaryNameNode 没有启动，请运行 sbin/stop-dfs.sh 关闭进程，然后再次尝试启动尝试）。
如果没有 NameNode 或 DataNode ，那就是配置不成功，请仔细检查之前步骤，或通过查看启动日志排查原因。

日志位置：
如果datanode没有启动（注意这会删除 HDFS 中原有的所有数据）
# 针对 DataNode 没法启动的解决方法
./sbin/stop-dfs.sh # 关闭
rm -r ./tmp # 删除 tmp 文件，注意这会删除 HDFS 中原有的所有数据
./bin/hdfs namenode -format # 重新格式化 NameNode
./sbin/start-dfs.sh # 重启
成功启动后，可以访问 Web 界面 http://localhost:50070 查看 NameNode 和 Datanode 信息，还可以在线查看 HDFS 中的文件。

来自为知笔记(Wiz)
查看全文

相关阅读:
牛客网暑期ACM多校训练营（第一场）
ACM-ICPC-Swiss-Subregional 2017 训练日志
 2016 全国多校第二场训练日志
 2018湖南多校第八场训练日志
 2017 全国多校第九场训练日志
 2017 全国多校第十场训练日志
 2014 Kuala Lumpur 训练日志
 2018湖南多校第五场-20180506 训练日志
 2017icpc 花莲训练日志
 面试总结

原文地址：https://www.cnblogs.com/iathena/p/5615735.html

最新文章
函数2
函数1
第二模块
 股票信息查询
 三级菜单
 用户交互程序
 Day8 文件
 Day5
误删代码
 Day4