zoukankan      html  css  js  c++  java
  • hive函数之~行转列与列转行

    4、行转列

    1.相关函数说明

    CONCAT(string A/col, string B/col…):返回输入字符串连接后的结果,支持任意个输入字符串;

    CONCAT_WS(separator, str1, str2,...):它是一个特殊形式的 CONCAT()。第一个参数剩余参数间的分隔符。分隔符可以是与剩余参数一样的字符串。如果分隔符是 NULL,返回值也将为 NULL。这个函数会跳过分隔符参数后的任何 NULL 和空字符串。分隔符将被加到被连接的字符串之间;

    COLLECT_SET(col):函数只接受基本数据类型,它的主要作用是将某字段的值进行去重汇总,产生array类型字段。

    2.数据准备

    表6-6 数据准备

    name

    constellation

    blood_type

    孙悟空

    白羊座

    A

    老王

    射手座

    A

    宋宋

    白羊座

    B

    猪八戒

    白羊座

    A

    凤姐

    射手座

    A

    3.需求

    把星座和血型一样的人归类到一起。结果如下:

    射手座,A            老王|凤姐

    白羊座,A            孙悟空|猪八戒

    白羊座,B            宋宋

    4.创建本地constellation.txt,导入数据

    node03服务器执行以下命令创建文件,注意数据使用 进行分割

    cd /export/servers/hivedatas

    vim constellation.txt

    孙悟空   白羊座   A

    老王       射手座   A

    宋宋       白羊座   B      

    猪八戒   白羊座   A

    凤姐       射手座   A

    6.按需求查询数据

    hive (hive_explode)> select
                            t1.base,
                            concat_ws('|', collect_set(t1.name)) name
                        from
                            (select
                                name,
                                concat(constellation, "," , blood_type) base
                            from
                                person_info) t1
                        group by
                            t1.base;

    5、列转行

    1.函数说明

    EXPLODE(col):将hive一列中复杂的array或者map结构拆分成多行。

    LATERAL VIEW

    用法:LATERAL VIEW udtf(expression) tableAlias AS columnAlias

    解释:用于和split, explode等UDTF一起使用,它能够将一列数据拆成多行数据,在此基础上可以对拆分后的数据进行聚合。

    2.数据准备

    cd /export/servers/hivedatas

    vim movie.txt

    数据字段之间使用 进行分割

    《疑犯追踪》      悬疑,动作,科幻,剧情

    《Lie to me》     悬疑,警匪,动作,心理,剧情

    《战狼2》    战争,动作,灾难

    3.需求

    将电影分类中的数组数据展开。结果如下:

    《疑犯追踪》      悬疑

    《疑犯追踪》      动作

    《疑犯追踪》      科幻

    《疑犯追踪》      剧情

    《Lie to me》     悬疑

    《Lie to me》     警匪

    《Lie to me》     动作

    《Lie to me》     心理

    《Lie to me》     剧情

    《战狼2》    战争

    《战狼2》    动作

    《战狼2》    灾难

    4.创建hive表并导入数据

    创建hive表

    create table movie_info(
        movie string,
        category array<string>)
    row format delimited fields terminated by "	"
    collection items terminated by ",";

    加载数据

    load data local inpath "/export/servers/hivedatas/movie.txt" into table movie_info;

    5.按需求查询数据

    select
        movie,
        category_name
    from
        movie_info lateral view explode(category) table_tmp as category_name;
  • 相关阅读:
    ThinkPHP框架 做个简单表单 添加数据例子__ACTION__ __SELF__
    ThinkPHP框架 系统规定的方法查询数据库内容!!同时也支持原生的SQL语句!
    ThinkPHP框架 基础 链接数据库
    ThinkPHP框架 3.2.2 获取系统常量信息 连接数据库 命名空间的理解
    ThinkPHP框架 自定义 Empty 方法保护本地信息不被暴露!!!
    Smarty模板保留缓存
    this指向
    phpcms v9 的表单向导功能的使用方法 附多个案例
    phpcms标签整理_当前栏目调用
    转载]PhpCms V9调用指定栏目子栏目文章的两种方法
  • 原文地址:https://www.cnblogs.com/lojun/p/13251412.html
Copyright © 2011-2022 走看看