Apache Hadoop的安装与配置

zoukankan html css js c++ java

Apache Hadoop的安装与配置
Hadoop很火，不学不好意思。由于资料很多、书籍很多。本文简略介绍。

1.安装ubuntu(或其他linux操作系统，或虚拟机上安装)

2.安装jdk，并配置环境变量

3.下载hadoop，解压。（http://hadoop.apache.org/，我下载了0.20.2）

4.伪分布模式配置

伪分布的Hadoop是只有一个节点的集群。在这个集群中，当前计算机既是master也是slave，既是namenode也是datanode，既是jobtracker也是tasktracker。这个模式适合我们个人使用。
```

<configuration>
    
    <property>
　　	<name>hadoop.tmp.dir</name>
　　	<value>/home/whuqin/tmp</value>
    </property>
    
　　<property>
　　	<name>fs.default.name</name>
　　  	<value>hdfs://localhost:9000</value>
　　</property>
</configuration>


<configuration>
    <property>
　　	<name>dfs.replication</name>
	<value>1</value>
　　</property>
</configuration>


<configuration>
   <property>
　	<name>mapred.job.tracker</name>
　　  	<value>localhost:9001</value>
　　</property>
</configuration>
```
这三个配置文件均在hadoop的安装目录下的conf里。

其他模式下的关键配置属性：

设置hadoop的java路径：conf下hadoop-env.sh，增加JAVA_HOME=/home/whuqin/jdk1.6.0_26（即jdk的安装目录）

为了便于使用hadoop，可创建一个指向hadoop安装目录的环境变量:

$ export HADOOP_INSTALL=/home/whuqin/hadoop-x.y.z

$ export PATH=$PATH:$HADOOP_INSTALL/bin

5.安装ssh

6.格式化HDFS文件系统: hadoop namenode -format

7.启动hadoop: start-all.sh。关闭：stop-all.sh

具体情况参考：http://xjtom78.iteye.com/blog/1107390
查看全文

相关阅读:
net.sf.fmj.media.cdp.civil.CaptureDevicePlugger addCaptureDevices解决方法
 SVN快速入门教程
 Struts 2详细工作流程
 未能加载.NET基类问题
 图片上传的例子
 一个.NET发邮件的简单例子
 一种巧妙的删除程序自己的方法
 oracle的问题
 javascript 中对Trim（）的实现
 SQL Server 不存在或访问被拒绝的问题

原文地址：https://www.cnblogs.com/whuqin/p/4982071.html