前言
Hadoop是基于Java语言开发的,具有很好跨平台的特性。Hadoop的所要求系统环境适用于Windows,Linux,Mac系统,我们推荐选择使用Linux或Mac系统。而Linux系统则可以在Windows上使用虚拟机或双系统安装使用。如果选择Linux,我们需要首先安装好Linux系统,然后在Linux系统的基础上,安装Hadoop。
在这里我选用的虚拟机中安装。由于UBuntu界面化较好,再加上自己是新手,所以我采用UBuntu操作系统。
ubuntu在虚拟机下的安装
一、系统下载地址
64位Ubuntu LTS 14.04的下载地址 下载地址
二、系统安装(因为整体安装的操作基本都是以厦门大学数据库实验室的指导教程所参考安装,所以在此提供关于在VirtualBox(虚拟化工具)安装Ubuntu、Hadoop的安装及配置、HDFS中Eclipse的安装 等详细的安装步骤的教程地址 之后着重对安装过程中存在问题进行说明)
提示:
Linux系统的安装主要有两种方式:虚拟机安装和双系统安装,由于虚拟机安装和使用Linux的硬件配置比较高,我们建议电脑比较新或者配置内存4G以上的电脑可以选择虚拟机安装,电脑较旧或配置内存小于等于4G的电脑强烈建议选择双系统安装,否则,在配置较低的计算机上运行LInux虚拟机,系统运行速度会非常慢.
前期准备:
1.因为要在虚拟机中安装,所以要先安装虚拟化工具VirtualBox、VMVare等,我安装的是VirtualBox。
VirtualBox的百度网盘下载地址
链接: https://pan.baidu.com/s/1p_uzSA2nDJljUDqR8L4XOA 提取码: hp1p
安装过程:
①在Windows中使用VirtualBox安装Ubuntu
http://dblab.xmu.edu.cn/blog/337-2/
注意问题:
(1)在安装VirtualBox虚拟机时,可能会弹出一些窗口询问是否要安装某些软件,一定要点击同意安装,否则,虚拟机不能正常运行。
(2)卸载虚拟机时,切不可直接在文件夹里删除,应该点击安装包,通过安装程序的“卸载”功能完成卸载。
(3)如果直接在文件夹中删除了虚拟机,导致虚拟机无法运行,建议下载360安全助手,彻底清理注册表后,再次安装。
(4)在VirtualBox创建虚拟电脑,建议安装Ubuntu16.04,不要安装CentOS,这样可以和林子雨老师课程实验环境完全吻合,同时注意要创建用户名hadoop。
(5)可能有些同学进行网络连接时会出现第一次可以连上网(wifi),当连接网线时无法正常连接网络,将虚拟机外的网络设置为以下属性即可:
Hadoop的安装及配置
在成功安装Linux系统后,开始进行Hadoop环境的搭建
在Ubuntu14.04系统下的Hadoop安装教程及单机/伪分布式配置
http://dblab.xmu.edu.cn/blog/install-hadoop/
注意问题:
① 安装Java环境时,JAVA_HOME的路径要编辑正确,修改一次,需要让环境变量生效一次。
②相对路径与绝对路径的区别,请务必注意命令中的相对路径与绝对路径,教程中出现的 ./bin/...
,./etc/...
等包含 ./ 的路径,均为相对路径,以 /usr/local/hadoop 为当前目录。例如在 /usr/local/hadoop 目录中执行 ./bin/hadoop version
等同于执行 /usr/local/hadoop/bin/hadoop version
。可以将相对路径改成绝对路径来执行,但如果你是在主文件夹 ~ 中执行 ./bin/hadoop version
,执行的会是 /home/hadoop/bin/hadoop version
,无法得到想要的结果,所以需要使用cd命令跳转到对应路径下执行相关命令。
③运行Hadoop伪分布实例时出现内存不足的错,即运行MapReduce作业时无法正常完成,
这可能是因为此时你的电脑内存运行过于多、速度过于慢,退出,减轻内存消耗,重新执行即可。
分布式文件系统HDFS 学习指南
Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)是Hadoop核心组件之一,如果已经安装了Hadoop,其中就已经包含了HDFS组件,不需要另外安装。
详细教程
http://dblab.xmu.edu.cn/blog/290-2/
注意问题:
Eclipse的安装可直接在Ubuntu自带的应用商店直接下载,安装时间过长,为保证文件的完整性尽量使用校园网或网速较快的网络下载,耐心等候。