zoukankan      html  css  js  c++  java
  • Hadoop-2.6.0 集群的安装配置

     

    一、安装软件

    1. Virtualbox

    2. Ubuntu 桌面版

    3. Hadoop2.6.0

    4. SSH

    5. JDK

     

    安装好virtualbox,过程不再赘述。按照一般的虚拟机安装方式安装就可以了!

    安装好virtualbox之后,在安装ubuntu虚拟机。安装ubuntu虚拟机需要注意的问题:

    说明: 我的安装时候设置了一个用户名为 ubuntuvim1,注意后面的设置会用到。

    1. 安装的虚拟机的联网方式需要设置成桥接方式,如果一开始设置不了,则等到虚拟机系统安装完成之后再安装增强工具,然后关闭虚拟机在设置网络链接模式,设置如下:

     

    Hadoop-2.6.0 <wbr>集群的安装配置

    界面名称使用eth0,控制芯片使用 82543GC,混杂模式使用全部允许,接入网线打勾。

    配置好之后虚拟机系统应该可以联网了,打开虚拟机里的firefox看看能不能上网,如果能上网说明网络配置成功!

    二、复制虚拟机

    Hadoop-2.6.0 <wbr>集群的安装配置 

    关闭刚刚创建好的虚拟机,打开oracle VM VirtualBox 管理器,在刚刚创建好的虚拟机上右键--》复制,等待复制完成。同理可以复制多个虚拟机!

    注意:使用完全复制的方式

      Hadoop-2.6.0 <wbr>集群的安装配置


     等到复制完成之后,在设置里修改刚刚复制的虚拟机,

     Hadoop-2.6.0 <wbr>集群的安装配置

    Hadoop-2.6.0 <wbr>集群的安装配置

     修改下名称,方便自己查看。

     Hadoop-2.6.0 <wbr>集群的安装配置

    其他设置都默认即可。

    三、配置虚拟机

    到这里我已经有3个虚拟机。并且设置桥接方式之后会自动为虚拟机设置虚拟机电脑的ip。可以在虚拟机里使用ifconfig(在终端输入)命令查看电脑ip

    启动虚拟机,并登录到ubuntu系统中。分别设置三个虚拟机如下:

    1. 修改虚拟机的主机名

    在终端输入:sudo gedit /etc/hostname

    说明:因为我安装的ubuntu是桌面版,所以可以使用gedit,如果你安装的是server版本的ubuntu是不能用gedit的,只能用vi,上面的命令就要改成:sudo vi /etc/hostname

    直接删除原来的字符,然后分别把三个虚拟机的hostname修改为:master slave1 slave2

      Hadoop-2.6.0 <wbr>集群的安装配置

    2. 使用ifconfig查看虚拟机电脑的ip。并记录下来,如下是我三个虚拟机的ip地址。

    主机名字

    ip

    master

    192.168.1.107

    slave1

    192.168.1.105

    slave2

    192.168.1.106

      

    3. 安装上表修改三个虚拟机的hosts文件

    在终端输入sudo gedit /etc/hosts

    下图是我的master虚拟机的配置

     Hadoop-2.6.0 <wbr>集群的安装配置


     下图是我的slave1虚拟机的配置

     Hadoop-2.6.0 <wbr>集群的安装配置

     下图是我的slave2虚拟机的配置

     Hadoop-2.6.0 <wbr>集群的安装配置

    四、安装SSH,配置无密码链接

    这步是比较难的,慢慢来,一步一步安装配置。

    1. 在三个虚拟机上都安装ssh,命令:sudo apt-get install ssh。等待安装完成。

    2. 配置ssh

    生成密钥,输入命令:ssh-keygen -t dsa -P ‘’ -f  ~/.ssh/id_dsa

    P是大写的,p后面接2个单引号;

    以上命令是产生公私密钥,产生目录在用户主目录下的.ssh目录中

     Hadoop-2.6.0 <wbr>集群的安装配置


    Id_dsa.pub为公钥,id_dsa为私钥,紧接着将公钥文件复制成authorized_keys文件,命令为:

    cd ~/.ssh

    cat id_dsa.pub >> anthorized_keys

    最后测试是否成功。终端输入2次:  ssh localhost  第一次需要输入系统的密码,第二次应该是不用密码的,如果第二次不用密码说明配置成功了。

    Hadoop-2.6.0 <wbr>集群的安装配置 

    上述ssh配置我的是在master里完成的。使用上述方法配置slave1和slave2。

    3. 让主结点(master)能通过SSH免密码登录两个子结点(slave),命令如下:

    首先进入.ssh目录:cd ~/.ssh

    [hadoop@master.ssh]$ scp authorized_keys slave1:/home/ubuntuvim1/.ssh/masterkey

    然后在slave1.ssh目录下可以看到masterkey,执行:cat masterkey >> authorized_keys

    以追加的方式添加到系统slave1里去

    [hadoop@master.ssh]$ scp authorized_keys slave2:/home/ubuntuvim1/.ssh/masterkey

    然后在slave2.ssh目录下可以看到masterkey,执行:cat masterkey >> authorized_keys

    以追加的方式添加到系统slave2里去

     

     测试

    Hadoop-2.6.0 <wbr>集群的安装配置 

    ubuntuvim1 为登录虚拟机的用户名,同理在slave1slave2上配置如下:

     

    [ubuntuvim1@slave1.ssh]$ scp authorized_keys slave2:/home/ubuntuvim1/.ssh/slave1key

    然后在slave2.ssh目录下可以看到masterkey,执行:cat slave1 >> authorized_keys

     

    [ubuntuvim1@slave1 .ssh]$ scp authorized_keys master:/home/ubuntuvim1/.ssh/slave1key

    然后在master.ssh目录下可以看到masterkey,执行:cat slave1key >> authorized_keys

      

    [ubuntuvim1@slave2 .ssh]$ scp authorized_keys master:/home/ubuntuvim1/.ssh/slave2key

    然后在master.ssh目录下可以看到slave2key执行:cat slave2key >> authorized_keys

      

    [ubuntuvim1@slave2 .ssh]$ scp authorized_keys slave1:/home/ubuntuvim1/.ssh/slave2key

    然后在slave1.ssh目录下可以看到slave2key执行:cat slave2key >> authorized_keys

     

    详细请看:http://www.cnblogs.com/yhason/archive/2013/05/30/3108908.html

    最后得到如下图

    Hadoop-2.6.0 <wbr>集群的安装配置 

    其实就是把各自的系统的id_rsa.pub复制到另一个虚拟机系统的.ssh/authorized_keys

    到此SSH无密码登录链接已经配置完成!

    五、安装JDK,配置JDK

    1. 下载jdk放到三个虚拟机的home下面,并用root权限解压(sudo tar -zxvf jdkxxx.gz

    2. 把得到的解压包复制到/usr/lib/jvm/下,没有目录则自己创建,如下:

    1. 创建目录并复制文件到/usr/lib/jvm

    sudo mkdir /usr/lib/jvm

     

    解压文件得到jdk

    sudo cp -r /home/ubuntuvim/soft/java/jdk1.7.0_65 /usr/lib/jvm/jdk7_65

     

    2. 修改配置文件

    sudo gedit /etc/profile 

     

    在文件末尾添加

    #set java environment

    export JAVA_HOME=/usr/lib/jvm/jdk7_65  

    export JRE_HOME=${JAVA_HOME}/jre  

    export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib  

    export PATH=${JAVA_HOME}/bin:$PATH

     

    3. 更新配置

    sudo update-alternatives --install /usr/bin/java java /usr/lib/jvm/jdk7_65/bin/java 300  

     

    sudo update-alternatives --install /usr/bin/javac javac /usr/lib/jvm/jdk7_65/bin/javac 300 

     

    执行:

    sudo update-alternatives --config java 

    选择自己配置的jdk

     

    4. 测试

    java -version

    查看是否是自己配置的jdk

    测试是否配置成功,终端输入:java -version 得到如下结果说明成功配置了jdk

    Hadoop-2.6.0 <wbr>集群的安装配置 

     

     

    六、安装Hadoop,配置Hadoop

    注意:先配置master,然后再把在 master里配置好的hadoop复制到另外2个虚拟机的相同目录下即可,不需要在一一配置。

    下面配置master里的hadoop

    下载hadoop2.6.0,解压放到/usr目录下,我的是:/usr/hadoop/hadoop-2.6.0

    注意:下面的配置文件都是在 hadoop-2.6.0/etc/hadoop/ 

    1. 配置hadoop-env.sh文件  配置conf/hadoop-env.sh文件 

    export JAVA_HOME=${JAVA_HOME  这里修改为

    export JAVA_HOME=/usr/lib/jvm/jdk7_65 

    说明:/usr/lib/jvm/jdk7_65 是安装jdk的目录,跟据自己安装的目录相应修改。

    Hadoop-2.6.0 <wbr>集群的安装配置 

    2. 配置文件:core-site.xml

    Hadoop-2.6.0 <wbr>集群的安装配置

    注意:hadoop.tmp.dir :Hadoop的默认临时路径,这个最好配置,如果不配置hadoop会默认使用的是系统的tmp目录。当系统重启的时候这目录里的东西会被清空,可能会导致hadoop出现一些莫名其妙的问题!

    由于篇幅有限,hadoop的配置放在这里了

    未完待续……

     

    版权声明:本文为博主原创文章,未经博主允许不得转载。

  • 相关阅读:
    pytest中参数化 @pytest.mark.parametrize()
    sublime text3 更换主题
    pytest中的assert断言
    python下文件的删除以及文件目录的清空
    python 在虚拟环境中安装项目依赖requirements.txt
    pycharm中配置默认的作者信息模板
    公司八点准点播放的歌曲《共和国之恋》
    应用程序pycharm 无法打开 【jetbrains家族软件打开报错】
    macbook 安装homebrew失败
    中文分词概述及结巴分词原理
  • 原文地址:https://www.cnblogs.com/ubuntuvim/p/4796531.html
Copyright © 2011-2022 走看看