zoukankan      html  css  js  c++  java
  • Ubuntu下hadoop环境的搭建(伪分布模式)

    Ubuntu下hadoop环境的搭建(伪分布模式)

    一、必要资源的下载

    1、Java jdk(jdk-8u25-linux-x64.tar.gz)的下载

    具体链接为:

    http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

    2、Hadoop(我们在这里选用hadoop0.20.2.tar.gz)的下载

    具体链接为:

    http://vdisk.weibo.com/s/zNZl3

    二、软件的安装(将下载好的文件放在home文件夹下)

    1、Java的安装(解压)

    在命令行下输入

    sudo tar xzvf jdk-8u25-linux-x64.tar.gz

    注意:可能会提示你输入用户密码

     

    解压完毕,Java安装完成

    2、hadoop的安装(解压)

    在命令行输入

    sudo tar xzvf hadoop0.20.2.tar.gz

    注意:可能会提示你输入用户密码

     

    解压完毕,hadoop0.20.2安装完成

    3、ssh的安装

    在系统联网的情况下,在命令行输入

    sudo apt-get install ssh

    注意:可能提示输入用户密码

     

    4、rsync的安装

    在系统联网的情况下,在命令行输入

    sudo apt-get install rsync

     

    三、环境的配置

    1、ssh的配置

    ssh需要配置成为免密码登录状态

    在命令行输入两句话:

    ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

    cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys

     

    配置完毕,验证ssh是否需要密码,在命令行输入:

    ssh localhost

            

             以下操作在hadoop-0.20.2文件夹中的conf下进行,在命令行输入 cd Hadoop-0.20.2/conf

    如果不能修改下面的文件的话,在home目录下命令行输入:

    sudo chmod 777 * -R

    以下的文件修改还可以用vi修改不熟悉vi的同学,请先学一下vi操作

    以下的文件修改也可以在文件目录直接用gedit打开修改

    2、修改hadoop-env.sh中的配置

    先找到Java安装目录

     

    将JAVA_HOME改成你安装Java JDK的绝对路径

    gedit hadoop-env.sh

     

    3、修改hadoop核心配置文件core-site.xml

    gedit core-site.xml

    <configuration>

    <property>

               <name>fs.default.name</name>

               <value>hdfs://localhost:9000</value>

    </property>

    </configuration>

     

    4、修改hadoop中HDFS的配置,修改replication

    gedit hdfs-site.xml

    <configuration>

    <property>

               <name>dfs.data.dir</name>

               <value>/home/mrchor/hadoop-0.20.2/data</value>

    </property>

    <property>

               <name>dfs.replication</name>

               <value>1</value>

    </property>

    </configuration>

     

    5、修改hadoop中MapReduce的配置文件,配置的是JobTracker的地址和端口

    gedit mapred-site.xml

    <configuration>

    <property>

               <name>mapred.job.tracker</name>

               <value>localhost:9001</value>

    </property>

    </configuration>

     

    四、hadoop的启动

    以下操作在hadoop-0.20.2文件夹下进行,在命令行输入:cd hadoop-0.20.2

    1、格式化hadoop中的文件系统HDFS

    bin/hadoop namenode –format

     

    2、启动hadoop环境

    bin/start-all.sh

     

         五、验证

    需要在浏览器中输入localhost:50030localhost:50070验证hadoop是否安装完成

     

     

    至此,hadoop的环境搭建完毕。

  • 相关阅读:
    mysql自动补齐
    重置oracle 11G的system、sys密码《亲测》
    细说业务逻辑(前篇)<转>
    当我们把这么一个“狭义的概念”与“这个概念本身”等同起来时,误会、迷茫、困惑、不屑就出现了。
    设计模式就三个准则
    面向对象编程(OOP)的三大特点
    在计算机中,“透明”一词的理解。
    关于ArrayList中添加对象的一个有趣问题~~~~
    MyEclipse 代码自动提示功能失效 提示No Default Proposals 或 no completions available 的解决方法
    面向对象的三大基本特征
  • 原文地址:https://www.cnblogs.com/cstzhou/p/4095657.html
Copyright © 2011-2022 走看看