今天主要写了实验4的第一个题目
spark-shell 交互式编程
请到本教程官网的“下载专区”的“数据集”中下载 chapter5-data1.txt,该数据集包含
了某大学计算机系的成绩,数据格式如下所示:
Tom | DataBase | 80 |
Tom | Algorithm | 50 |
Tom | DataStructure | 60 |
Jim | DataBase | 90 |
Jim | Algorithm | 60 |
Jim | DataStructure | 80 |
…… |
将Data01.txt放在/usr/local/spark/sparkdata中
权限设置:
(1)该系总共有多少学生;
(2)该系共开设来多少门课程;
![](https://img2018.cnblogs.com/i-beta/1278188/202002/1278188-20200208204201174-1110044787.png)
(3)Tom 同学的总成绩平均分是多少;
![](https://img2018.cnblogs.com/i-beta/1278188/202002/1278188-20200208204207099-611841880.png)
(4)求每名同学的选修的课程门数;
![](https://img2018.cnblogs.com/i-beta/1278188/202002/1278188-20200208204212794-1958576347.png)
(5)该系 DataBase 课程共有多少人选修;
![](https://img2018.cnblogs.com/i-beta/1278188/202002/1278188-20200208204219794-1440132978.png)
(6)各门课程的平均分是多少;
![](https://img2018.cnblogs.com/i-beta/1278188/202002/1278188-20200208204225316-1177529347.png)
(7)使用累加器计算共有多少人选了 DataBase 这门课。
这道题遇到了一点问题
目前只到了这一步
![](https://img2018.cnblogs.com/i-beta/1278188/202002/1278188-20200208204233586-728368191.png)
补:第七题