zoukankan      html  css  js  c++  java
  • Windows下Hadoop eclipse开发平台搭建

    Hadoop 在Windows环境下的搭建教程


      搞了一个下午,在Linux和Windows下都成功了,步骤相差不大。一些小问题,google一下就能解决。但还是推荐在linux下搭建,很容易切稳定。


    1.必要条件

      Cygwin :我的版本是目前最新的2.774

      java JDK

      hadoop 0.20.2 迅雷连接(有可能已经失效):thunder://QUFodHRwOi8vZGwuY3IxNzMuY29tLy9zb2Z0My9oYWRvb3AuemlwWlo=

      eclipse


    2. java安装

      具体参考百度。。。。。


     3.Cygwin的安装

       可以按照默认的提示安装到自己需要存放的位置,但是在安装时需要注意下面几点:   

    • Net    下的:openssh,openssl

    • Base  下的:sed (若需要Eclipse,必须sed)

    • Devel 下的:subversion(建议安装)

                   

      不同的版本可能有所不同,但是基本操作没有变化。。。。

      CygWin的bin目录以及usr/sbin 追加到系统环境变量PATH中。


    4.启动SSH服务

    以管理员权限运行Cygwin,并输入

    SSH-HOST-CONFIG

    接下来,系统会提示以下信息 

    should privilege  separation be used ?    回答:no
    if sshd should be installed as service?   回答:yes
    the value of CYGWIN environment variable  输入: ntsec

    成功的话,会有下面的提示

    Host configuration finished. Have fun!

     

      不要高兴太早,我们还需要在Windows服务中,开启Cygwin服务。 

         还有活要干。。。

       在Cygwin下操作:

    • 输入ssh-keygen,回车直到完成输出
    • 进入~/.ssh,cd ~/.ssh
    • 复制,cp id_rsd.pub anthorized_keys
    • 退出,exit

      如果没有任何问题的话,应该是完成了。

      输入ssh localhost开启SSH服务。(PS:这里我一直都是错误的,不知道为啥我重启下了电脑,好了)


     5.hadoop安装

      下载hadoop,解压缩到Cygwin下,修改名称为hadoop,方便使用。这里只部署在一个机器上。

      需要我们首先修改一些Hadoop的配置信息(这里的端口9000和9001确保没有被占用,也可改变为其他):

    • hadoop-env.sh
    • core-site.xml
    • hdfs-site.xml
    • mapred-site.xml
    //打开hadoop/conf/hadoop-env.sh文件
    export JAVA_HOME=/usr/lib/jvm/java
    //打开conf/core-site.xml文件
    <?xml version="1.0"?> 
    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> 
                                                                                                                   
    <!-- Put site-specific property overrides in this file. -->
                                                                                                                   
    <configuration> 
    <property>   
      <name>fs.default.name</name>   
      <value>hdfs://localhost:9000</value>    
     </property>   
    </configuration>
    //打开conf/mapred-site.xml文件
    
    <?xml version="1.0"?> 
    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> 
                                                                                                                
    <!-- Put site-specific property overrides in this file. -->
                                                                                                                
        <configuration>   
         <property>    
          <name>mapred.job.tracker</name>   
          <value>localhost:9001</value>    
         </property>   
        </configuration>
    //打开conf/hdfs-site.xml文件
    <?xml version="1.0"?> 
    <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
    <configuration> 
    <property> 
    <name>dfs.name.dir</name> 
    <value>/usr/local/hadoop/datalog1,/usr/local/hadoop/datalog2</value> 
    </property> 
    <property> 
    <name>dfs.data.dir</name> 
    <value>/usr/local/hadoop/data1,/usr/local/hadoop/data2</value> 
    </property> 
    <property> 
    <name>dfs.replication</name> 
    <value>1</value> 
    </property> 
    </configuration>

     可以启动hadoop了,激动~~

    1.创建Logs日志目录

    mkdir logs

    2.格式化namenode,创建HDFS(这要进入hadoop文件夹内操作)

    bin/hadoop namenode -format

    3.启动hadoop

    bin/start-all.sh

    4.执行JPS

    完成启动~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

    输入网址:http://localhost:50030


    6.配置eclipse 

      Hadoop自带eclipse插件,在hadoop\contrib\eclipse-plugin中。

      具体配置步骤如下:

      hadoop-0.20.2-eclipse-plugin.jar放入eclipse的插件文件夹中,开启eclipse。

      window->Preference->Hadoop Map/Reduce,输入hadoop文件夹位置。

          

      window->Show View,选择Map/Reduce Locations。

          

      点击屏幕右下方新建一个Location.

      

      编辑Location.(注意MAP/REDUCE和DFS的Port分别对应mapred-site.xml和core-site.xml),高级的我设置了Hadoop.tmp.dir

      

      这时,打开Project Explore,刷新。

      

      接下来,你可以new一个MapReduce程序了,找到hadoop的例子试试去吧。

      对了,编译这里要配置一下。

      选择Run Configurations->Java Application->Arguments,这里要填入为两个文件,分别为输入文件和输出文件。

      

    主要参考:http://blog.csdn.net/johnnywww/article/details/7378284

         http://blog.csdn.net/ruby97/article/details/7423088

  • 相关阅读:
    VS Code设置同步
    ASP.NET Core 发布
    CMD命令
    通过注册表为文件(夹)添加右键菜单
    win+r 以管理员身份运行
    .NET Core部署Windows服务
    .NET Core的打包到一个exe程序
    C#枚举
    C#生成Guid
    使用Visual Studio的单元测试
  • 原文地址:https://www.cnblogs.com/coder2012/p/3096631.html
Copyright © 2011-2022 走看看