一、学习视频
https://www.bilibili.com/video/BV1oE411s7h7?p=46
二、保存方式
df.write.txt("文件目录") 保存为txt文件
df.write.json() 保存为json文件
df.write.parquet() 保存为parquet文件
df.write.formate("txt").save("文件目录")
三、常用操作
3.1 df.printSchema() 打印df的模式信息
3.2 df.select(df["列名"]).show 选取列值并展示
3.3 df.filter(过滤条件) 将符合条件的信息过滤出来
3.4 df.groupBy("列名").count().show 分组后统计该列的数据并展示
3.5 df.sort(df["列名"].desc()).show() 按照列名的降序进行排序,升序是asc()