spark-shell交互式编程:
根据某大学计算机系的成绩数据,完成编程,数据格式如下
1.该系共有多少个学生:
首先新建RDD
通过map函数与分割函数得到第一列数据作为新的RDD
RDD去重
行数
2.该系共开设多少课程:
3.求Tom同学的平均分:
通过filter函数进行筛选
计算总数
求平均数
4.求每名同学的选修的课程门数:
5.该系DataBase课程共有多少人选修:
6.各门课程的平均分是多少:
7.使用累加器计算共有多少人选了DataBase这门选修: