hive数据(实际数据)存储一部分存储在HDFS,另一部分(元数据信息)存储在关系型数据库上。
HIVE通过以下模型来组织hdfs数据
-数据库(database)
-表(Table)
-分区(Partition)
-桶(Bucket)
(database)-------hive上的一个目录
(Table)------------database下的子目录
根据数据是否受Hive管理,分为:
Managed Table(管理表):HDFS存储数据受Hive管理,HIVE对表的删除操作影响实际数据的删除
External Table(外表):HDFS存储路径不受HIVE管理,HIVE对表的删除操作仅仅删除元数据。