- 掌握 Linux 虚拟机的安装方法。Spark 和 Hadoop 等大数据软件在 Linux 操作系统上运行可以发挥最佳性能,因此,本教程中,Spark 都是在 Linux 系统中进行相关操作,同时,下一章的 Scala 语言也会在 Linux 系统中安装和操作。鉴于目前很多读者正在使用Windows 操作系统,因此,为了顺利完成本教程的后续实验,这里有必要通过本实验,让读者掌握在 Windows 操作系统上搭建 Linux 虚拟机的方法。当然,安装 Linux 虚拟机只是安装 Linux 系统的其中一种方式,实际上,读者也可以不用虚拟机,而是采用双系统的方式安装 Linux 系统。本教程推荐使用虚拟机方式。
- 熟悉 Linux 系统的基本使用方法。本教程全部在 Linux 环境下进行实验,因此,需要读者提前熟悉 Linux 系统的基本用法,尤其是一些常用命令的使用方法。
- 操作系统:Windows 系统和 Ubuntu(推荐)。
- 虚拟机软件:推荐使用的开源虚拟机软件为 VirtualBox。VirtualBox 是一款功能强大的免费虚拟机软件,它不仅具有丰富的特色,性能也很优异,且简单易用,可虚拟的系统包括Windows、Mac OS X、Linux、OpenBSD、Solaris、IBM OS2 甚至 Android 4.0 系统等操作系统。读者可以在 Windows 系统上安装 VirtualBox 软件,然后在 VirtualBox 上安装并且运行Linux 操作系统。
- 安装 Linux 虚拟机
- 使用 Linux 系统的常用命令
- (1)切换到目录 /usr/bin;
- (2)查看目录/usr/local 下所有的文件;
- (3)进入/usr 目录,创建一个名为 test 的目录,并查看有多少目录存在;
- (4)在/usr 下新建目录 test1,再复制这个目录内容到/tmp;
- (5)将上面的/tmp/test1 目录重命名为 test2;
- (6)在/tmp/test2 目录下新建 word.txt 文件并输入一些字符串保存退出;
- (7)查看 word.txt 文件内容;
- (8)将 word.txt 文件所有者改为 root 帐号,并查看属性;
- (9)找出/tmp 目录下文件名为 test2 的文件;
- (10)在/目录下新建文件夹 test,然后在/目录下打包成 test.tar.gz;
- (11)将 test.tar.gz 解压缩到/tmp 目录。
(1)切换到目录 /usr/bin;
输入cd /usr/bin
(2)查看目录/usr/local 下所有的文件;
ls /usr/local
(3)进入/usr 目录,创建一个名为 test 的目录,并查看有多少目录存在;
cd /usr
sudo mkdir test
ls
(4)在/usr 下新建目录 test1,再复制这个目录内容到/tmp;
cd /usr
mkdir test1
cp -a /usr/test1 /tmp
(5)将上面的/tmp/test1 目录重命名为 test2;
mv /tmp/test1 /tmp/test2
(6)在/tmp/test2 目录下新建 word.txt 文件并输入一些字符串保存退出;
cd /tmp/test2
gedit word.txt
(7)查看 word.txt 文件内容;
vim /tmp/test2/word.txt
(8)将 word.txt 文件所有者改为 root 帐号,并查看属性;
chown root /tmp/test2/word.txt
ls -l word.txt
(9)找出/tmp 目录下文件名为 test2 的文件;
find /tmp/test2
(10)在/目录下新建文件夹 test,然后在/目录下打包成 test.tar.gz;
cd /
mkdir test
tar -czvf test.tar.gz test
(11)将 test.tar.gz 解压缩到/tmp 目录。
tar -zxvf test.tar.gz -C /tmp/