zoukankan html css js c++ java

Hadoop

进行Hadoop伪分布式搭建时，需要有一定的Linux命令基础,

因为Hadoop是搭建在Linux环境上的开源框架,

Hadoop的框架最核心的设计就是：HDFS和MapReduce。

本文也主要讲述HDFS和MapReduce环境的搭建。

搭建环境：

虚拟机： VMware10

操作系统：CentOS-6.5

JDK版本：jdk-8u171-linux-x64

Hadoop版本：hadoop-2.7.3

使用工具：Xshell 6，Xftp 6，Notepad++

虚拟机ip地址：192.168.72.10

一、虚拟机网络环境配置

1.首先移动到网络配置文件的目录下：

[root@localhost ~]# cd /etc/sysconfig/network-scripts.

2.查看一下文件夹下的文件

[root@localhost network-scripts]# ls

3.修改配置文件ifcfg-eth0(网络连接采用net模式)

[root@localhost network-scripts]# vi ifcfg-eth0

　ifcfg-eth0

DEVICE=eth0
HWADDR=00:0C:29:2C:8A:1C
TYPE=Ethernet
UUID=a3222bc4-07ad-4b2c-8168-9123758f0333
ONBOOT=yes
NM_CONTROLLED=yes
BOOTPROTO=static
IPADDR=192.168.72.10
NETMASK=255.255.255.0
GATEWAY=192.168.72.2

根据虚拟网络编辑器 IPADDR：是虚拟机的静态 ip , GETWAY : 是虚拟机的网关

按i进入编辑模式，进行文件的编辑，Esc退出编辑模式，：wq进行保存

4.重启网络服务：

[root@localhost network-scripts]# service network restart

5.配置DNS服务器：

[root@localhost network-scripts]# vi /etc/resolv.conf

6.检测网络配置

[root@localhost network-scripts]# ping www.baidu.com

二、java的安装和配置

1.下载jdk

jdk1.8 http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

2.利用ftp 6上传到CentOS-6.5上的/soft文件夹下

3.解压压缩包

[root@localhost soft]# tar -zxvf jdk-8u171-linux-x64.tar.gz

4.修改文件名

[root@localhost soft]# mv jdk-1.8.0_161 jdk

5.移动到环境变量配置文件夹(隐藏文件夹)

[root@localhost soft]# cd /etc/profile.d/

5.新建环境变量文件：

[root@localhost profile.d]# vi java.sh

6.进行环境变量配置：

　java.sh

JAVA_HOME=/soft/jdk
PATH=$PATH:$JAVA_HOME/bin
CLASSPATH=$CLASSPATH:$JAVA_HOME/lib
export JAVA_HOME PATH CLASSPATH

7.启动环境变量生效：

[root@localhost profile.d]# source java.sh

8.查看jdk安装版本

[root@localhost profile.d]# java -version

三、安装SSh配置密钥免登陆

1.安装ssh客户端

[root@localhost profile.d]# yum install -y openssh-clients openssh-server

2.切换到根目录

[root@localhost profile.d]# cd ~

3.生成密钥：

[root@localhost ~]# ssh-keygen -t rsa

（一路回车）

4.进入隐藏目录：

[root@localhost ~]# cd .ssh

5.拷贝密钥文件：

[root@localhost .ssh]# cd id_rsa.pub  authorized_keys

6.检验ssh

[root@localhost .ssh]# ping 92.168.72.10

四、Hadoop的安装及配置

1.下载hadoop安装包

http://apache.claz.org/hadoop/common/

2.利用ftp 6上传到CentOS-6.5上的/soft文件夹下

3.解压压缩包

[root@localhost soft]# tar -zxvf hadoop-2.7.3.tar.gz

4.更换目录文件名

[root@localhost soft]# mv hadoop-2.7.3 hadoop

5.移动到配置文件目录

[root@localhost profile.d]# cd /etc/profile.d

6.配置环境变量

[root@localhost profile.d]# vi hadoop.sh

　　hadoop.sh

HADOOP_HOME=/soft/hadoop
PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_HOME PATH

7.启动hadoop环境变量配置文件

[root@localhost profile.d]# source hadoop.sh

8.检验是否配置好，查看hadoop版本号

[root@localhost profile.d]# hadoop version

五、HDFS的配置管理

1.移动到配置文件目录下

[root@localhost profile.d]# cd /soft/hadoop/etc/hadoop/

2.浏览一下文件夹，会发现core-site.xml hdfs-site.xml

3.建立hdfs的namenode和datanode的文件夹

mkdir -p /hadoop/tmp
mkdir -p /hadoop/dfs/name
mkdir -p /hadoop/dfs/node

4.修改配置文件配置

core-site.xml

<configuration>
    <property>
      <name>fs.defaultFS</name>
      <value>hdfs://192.168.72.10:9000</value>
    </property>
    <property>
      <name>hadoop.tmp.dir</name>
      <value>/hadoop/tmp</value>
    </property>
</configuration>

hdfs-site.xml

<configuration>
    <property>
      <name>dfs.namenode.name.dir</name>
      <value>/hadoop/dfs/name</value>
    </property>
    <property>
      <name>dfs.datanode.data.dir</name>
      <value>/hadoop/dfs/data</value>
    </property>
    <property>
      <name>dfs.replication</name>
      <value>1</value>
    </property>
    <property>
      <name>dfs.permissions.enabled</name>
      <value>false</value>
    </property>
</configuration>

5.格式化namenode

[root@localhost hadoop]# hadoop namenode -format

6.查看进程：

[root@localhost hadoop]# jps

多了三个进程NameNode，SecondaryNameNode，DataNode

7.检验管理hdfs

可以通过浏览器查看管理hdfs，通过windows浏览器输入网址 http://192.168.72.10:50070/

8.HDFS操作

//建立文件夹：
[root@localhost hadoop]# hdfs dfs -mkdir /hadoop

//上传文件（把当前目录下abc.txt传到hdfs的hadoop上）
[root@localhost hadoop]# hdfs dfs -put abc.txt /hadoop

六、MapReduce的配置管理

1.移动到配置文件夹

[root@localhost hadoop]# cd /soft/hadoop/etc/hadoop

2.生成配置文件

[root@localhost hadoop]# cp mapred-site.xml.template  mapred-site.xml

此时文件夹下存在mapred-site.xml 和yarn-site.xml

3.修改配置文件

mapred-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

yarn-site.xml

<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>192.168.72.10</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

4.移动至启动的文件夹

[root@localhost hadoop]# cd /soft/hadoop/sbin/

5.启动mapreduce资源管理和调度

[root@localhost sbin]# start-yarn.sh

6.查看启动进程

[root@localhost sbin]# jps

发现多了ResourseManager,NodeManager

至此，hadoop伪分布式搭建完成，大家在搭建的过程中要有耐心，

每进行一步时要进行最后的检验，能够成功后进行下一步，

有什么问题可以在评论区留言，我会及时回复，希望能给大家带来帮助。

查看全文

相关阅读:
带符号数的移位
 day03-Java语言基础之运算符
 day02Java语言基础数量部分
 day01Java概述
 交换机光口识别与连接问题
 wireshark怎么抓包
 Java中的语句
 构建主键批注的方法
 通过反射，获得数据库增删改查的sql语句的方法
 sql语句

原文地址：https://www.cnblogs.com/suifengye/p/9337873.html