1. 下载并解压安装脚本: Hortonworks Data Platform (HDP) for Docker
2. 进入到解压后的目录,运行下面的命令,{HDPversion} 需要替换成相应目录里的版本:
$ sh docker-deploy-{HDPversion}.sh
这一步会花很长时间,需要拉取 docker 镜像(hortonworks/sandbox-hdp 和 hortonworks/sandbox-proxy), 总共大约有 20多G。
3. 成功运行后,运行: docker ps ,可以看到有两个容器在运行。
4. 运行下面的命令,查看 sandbox-hdp 对应的 IP
$ docker inspect sandbox-hdp | grep IPAddress
5. 进入容器,172.18.0.2 是刚得到的 IP
$ ssh 172.18.0.2
初始用户是 root,密码是 hadoop。 进入后会要求更改 root 的密码。
6. 更改完 root 的密码后,运行下在的命令,设置 admin 的密码。
$ ambari-admin-password-reset
7. 打开 http://192.168.7.132:1080 ,就会显示如下的页面。
8. 点击 "LAUNCH DASHBOARD",会打开一个登陆页。可以用 admin 和第6步中设置的密码登陆。还可以使用下面的用户/密码登陆:
- maria_dev/maria_dev 角色:Spark and SQL Developer 主要用于查看 HDP 中的组件
- raj_ops/raj_ops 角色:Hadoop Warehouse Operator 用于基础构件的 build, research 和 deployment
- holger_gov/holger_gov 角色:Data Steward 主要管理数据(内容和元数据)
- amy_ds/amy_ds 角色:Data Scientist 主要使用 Hive, Spark and Zeppelin 去做数据分析、数据清理和数据转换
9. 停止
docker stop sandbox-hdp
docker stop sandbox-proxy
10. 启动
docker start sandbox-hdp
docker start sandbox-proxy