zoukankan      html  css  js  c++  java
  • Hive初识(二)

    Hive分区

    Hive组织表到分区。它是将一个表到基于分区列,如日期,城市和部门的值相关方式。使用分区,很容易对数据进行部分查询。

    表或分区是细分成桶,以提供额外的结构,可以使用更高效的查询的数据。桶的工作是基于表的一些列的散列函数值。

    例如,一个名为Tab1表包含雇员数据,如id,name,dept和yoj(加盟年份)。假设需要检索所有在2012年加入,查询搜索整个表所需的信息员工的详细信息。但是,如果用年份分区雇员数据并将其存储在一个单独的文件,它减少了查询处理的时间。下面的示例演示如何分区的文件和数据:

    下面文件包含employee数据表。

    /tab1/employeedata/file1

    id, name, dept, yoj
    1, gopal, TP, 2012
    2, kiran, HR, 2012
    3, kaleel,SC, 2013
    4, Prasanth, SC, 2013

    上面的数据被划分成使用年两个文件。

    /tab1/employeedata/2012/file2

    1, gopal, TP, 2012
    2, kiran, HR, 2012

    /tab1/employeedata/2013/file3

    3, kaleel,SC, 2013
    4, Prasanth, SC, 2013


    添加分区

    可以通过添加分区表改变所述表。假设我们有一个表叫employee,拥有如 Id, Name, Salary, Designation, Dept, 和 yoj等字段。

    语法:

    ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec
    [LOCATION 'location1'] partition_spec [LOCATION 'location2'] ...;
    
    partition_spec:
    : (p_column = p_col_value, p_column = p_col_value, ...)

    以下查询用于将分区添加到employee表。

    hive> ALTER TABLE employee
    > ADD PARTITION (year=’2013’)
    > location '/2012/part2012';


    重命名分区

    此命令的语法如下:

    ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;
    

    以下查询用来命名一个分区:

      ALTER TABLE employee PARTITION (year=’1203’) RENAME TO PARTITION (Yoj=’1203’);


    删除分区

    下面语法用于删除分区:

    ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec, PARTITION partition_spec,...;

    以下查询是用来删除分区:

    ALTER TABLE employee DROP [IF EXISTS] PARTITION (yeat='1203');
  • 相关阅读:
    Python基础-socketserver
    MySQL数据库-pymysql模块操作数据库
    MySQL数据库-外键链表之一对多,多对多
    MySQL数据库-表内容操作
    第02组 Alpha冲刺(5/6)
    第02组 Alpha冲刺(4/6)
    第02组 Alpha冲刺(3/6)
    第02组 Alpha冲刺(2/6)
    第02组 Alpha冲刺(1/6)
    第02组 团队Git现场编程实战
  • 原文地址:https://www.cnblogs.com/Mayny/p/9374155.html
Copyright © 2011-2022 走看看