第三步:测试Spark集群
把Spark安装包下的”README.txt”上传到
通过hdfs的web控制台可以发现成功上传了文件:
使用“MASTER:spark://SparkMaster:7077 ./spark-shell”命令启动Spark shell:
接下来通过以下命令读取刚刚上传到HDFS上的“README.md”文件 :
对读取的文件进行以下操作:
接下来使用collect命令提交并执行Job: