我在硕士期间的课题做的是狭义上的一种大数据分析,在学校里的大数据不是实际生产中的大数据量级。因此学校里的大数据分析使用单机来使用一系列的机器学习方法进行处理就绰绰有余了,但是想在大数据领域有更好更全面的发展,获得更为综合性的知识,需要学习Spark和Hadoop。
接到正题,因为Hadoop最主要是在Linux操作系统环境下运行,但是我所使用的电脑是Windows系统,因此需要安装一个虚拟机来在Windows电脑上运行Linux系统。
1)VirtualBox下载:
网址:https://www.virtualbox.org/wiki/Downloads
选择VirtualBox Windows版本
2)运行VirtualBox安装程序
3)开始安装VirtualBox
4)选择VirtualBox功能
5)警告界面
点击Yes就好了
6)安装完成
7)启动VirtualBox界面
8)配置完虚拟机之后,就可以显示了