1.什么是分区表
在大数据中,最常用的一种思想就是分治,我们可以把大的文件分割成一个个的小文件,这样每次操作一个小文件就很容易了。在hive中仍然支持这种操作,将大的数据按照时间等划分成一个个的小文件,存放在不同的文件夹中。
2.创建分区表
关键字:partitioned by(分区字段,类型)分区字段与表没有联系,在向该表中加载数据时,为分区字段指定参数,系统会自动创建该目录,将文件保存入该目录下
分区字段可以有多个,一个分区字段会创建一级文件夹,多个分区字段会创建多级文件夹
3.向分区表中加载数据
4.查看某一分区的数据
5.多分区联合查询
6.查看分区
7.添加分区
8.删除分区