Ubuntu下hadoop环境的搭建(伪分布模式)
一、必要资源的下载
1、Java jdk(jdk-8u25-linux-x64.tar.gz)的下载
具体链接为:
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
2、Hadoop(我们在这里选用hadoop0.20.2.tar.gz)的下载
具体链接为:
http://vdisk.weibo.com/s/zNZl3
二、软件的安装(将下载好的文件放在home文件夹下)
1、Java的安装(解压)
在命令行下输入
sudo tar xzvf jdk-8u25-linux-x64.tar.gz
注意:可能会提示你输入用户密码
解压完毕,Java安装完成
2、hadoop的安装(解压)
在命令行输入
sudo tar xzvf hadoop0.20.2.tar.gz
注意:可能会提示你输入用户密码
解压完毕,hadoop0.20.2安装完成
3、ssh的安装
在系统联网的情况下,在命令行输入
sudo apt-get install ssh
注意:可能提示输入用户密码
4、rsync的安装
在系统联网的情况下,在命令行输入
sudo apt-get install rsync
三、环境的配置
1、ssh的配置
ssh需要配置成为免密码登录状态
在命令行输入两句话:
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys
配置完毕,验证ssh是否需要密码,在命令行输入:
ssh localhost
以下操作在hadoop-0.20.2文件夹中的conf下进行,在命令行输入 cd Hadoop-0.20.2/conf
如果不能修改下面的文件的话,在home目录下命令行输入:
sudo chmod 777 * -R
以下的文件修改还可以用vi修改不熟悉vi的同学,请先学一下vi操作
以下的文件修改也可以在文件目录直接用gedit打开修改
2、修改hadoop-env.sh中的配置
先找到Java安装目录
将JAVA_HOME改成你安装Java JDK的绝对路径
gedit hadoop-env.sh
3、修改hadoop核心配置文件core-site.xml
gedit core-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
4、修改hadoop中HDFS的配置,修改replication
gedit hdfs-site.xml
<configuration>
<property>
<name>dfs.data.dir</name>
<value>/home/mrchor/hadoop-0.20.2/data</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
5、修改hadoop中MapReduce的配置文件,配置的是JobTracker的地址和端口
gedit mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
四、hadoop的启动
以下操作在hadoop-0.20.2文件夹下进行,在命令行输入:cd hadoop-0.20.2
1、格式化hadoop中的文件系统HDFS
bin/hadoop namenode –format
2、启动hadoop环境
bin/start-all.sh
五、验证
需要在浏览器中输入localhost:50030和localhost:50070验证hadoop是否安装完成
至此,hadoop的环境搭建完毕。