作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3223
一、在VMware Workstation安装Ubuntu
点击文件 ---> 新建虚拟机

稍后才安装系统

选择Linux的版本

指定磁盘容量

创建好虚拟机

使用ubuntu镜像文件安装系统

二、创建hadoop用户
创建

设密码

加入sudo权限

三、安装MySQL
更新软件资源库

安装mysql

开启mysql服务

四、安装java环境
下载jdk

配置环境变量


检验环境变量

五、window使用xshell传文件到ubuntu
安装ssh

启动ssh和验证是否可以远程登录

生成密匙

配置ssh无密码登录

window安装xsehll6

点击文件-->新建,输入Ubuntu的ip

连接成功后,点击图中工具栏绿色按钮

点击取消

弹出一个新会话

把文件拖动到新建会话黑色界面中就可传到Ubuntu。。

六、安装hadoop
解压

移动文件到 /usr/local目录

重命名文件夹

修改文件夹权限

检查hadoop是否可用

七、运行单机模式
运行grep例子



运行结果

八、运行伪分布模式
配置文件参考:https://www.cnblogs.com/MissDu/p/8831525.html
修改文件

core-site.xml文件

hdfs-site.xml文件

格式化NameNode

开启NameNode和DataNode失败,但是JAVA_HOME已经配置了

在网上找到原因,需要修改hadoop-env.sh文件



开启NameNode和DataNode成功

检测是否开启成功,成功则会出现下面进程

伪分布运行实例


运行结果

可把hdfs的output文件夹复制到本地
