Hadoop完整搭建过程（一）：本地模式 - 走看看

zoukankan html css js c++ java

Hadoop完整搭建过程（一）：本地模式
1 本地模式

本地模式是最简单的模式，所有模块都运行在一个JVM进程中，使用本地文件系统而不是HDFS。

本地模式主要是用于本地开发过程中的运行调试用，下载后的Hadoop不需要设置默认就是本地模式。

2 准备工作

笔者喜欢把JDK放在/usr/local下，运行前请确保设置了JAVA_HOME，注意是在etc/hadoop/hadoop-env.sh中设置：
```
tar -zxvf openjdk-11+28_linux-x64_bin.tar.gz
sudo mv openjdk-11+28_linux-x64_bin /usr/local/java
sudo vim HADOOP/etc/hadoop/hadoop-env.sh # HADOOP为Hadoop安装目录
# 输入
export JAVA_HOME=/usr/local/java
```
3 使用

官网关于该模式没有太多的描述，只有一个使用默认配置文件作为输入，然后匹配正则表达式作为输出的简单例子：
```
# HADOOP表示Hadoop安装目录
mkdir input
cp HADOOP/etc/hadoop/*.xml input
HADOOP/bin/hadoop jar HADOOP/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.0.jar grep input output 'dfs[a-z.]+'
cat output/*
```
从下图的id可以看出是以本地模式工作的：

4 输出

输出文件夹output有两个文件：
- _SUCCESS：是个空文件，表示运行成功
- part-r-00000：输出结果文件，词数统计
part-r-00000结果如上图所示。

实际上本地模式不需要特别的处理，因为默认就是本地模式。

5 参考
- Hadoop3.3.0官方文档
查看全文

相关阅读:
什么是整型数据类型
 什么是布尔型（boolean）数据类型？
PHP的八种数据类型
 php中session时间设置详解
 php中session数据库存储实例详解
 php中session临时文件和缓存说明
 php自定义Session的信息处理说明
 如何通过Session对用户操作权限进行判断的实例详解
 php中的Session是什么
 php中如何传递Session ID

原文地址：https://www.cnblogs.com/6b7b5fc3/p/13544870.html

Copyright © 2011-2022 走看看