zoukankan      html  css  js  c++  java
  • Hive的UDF(用户自定义函数)开发

      当 Hive 提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF:user-defined function)。

    测试各种内置函数的快捷方法:

    创建一个 dual 表

    create table dual(id string);

    load 一个文件(只有一行内容:内容为一个空格)到 dual 表

    新建 JAVA maven 项目

    添加依赖

    <dependencies>
            <dependency>
                <groupId>org.apache.hive</groupId>
                <artifactId>hive-exec</artifactId>
                <version>1.2.1</version>
            </dependency>
            <dependency>
                <groupId>org.apache.hadoop</groupId>
                <artifactId>hadoop-common</artifactId>
                <version>2.7.4</version>
            </dependency>
        </dependencies>
        <build>
            <plugins>
                <plugin>
                    <groupId>org.apache.maven.plugins</groupId>
                    <artifactId>maven-shade-plugin</artifactId>
                    <version>2.2</version>
                    <executions>
                        <execution>
                            <phase>package</phase>
                            <goals>
                                <goal>shade</goal>
                            </goals>
                            <configuration>
                                <filters>
                                    <filter>
                                        <artifact>*:*</artifact>
                                        <excludes>
                                            <exclude>META-INF/*.SF</exclude>
                                            <exclude>META-INF/*.DSA</exclude>
                                            <exclude>META-INF/*.RSA</exclude>
                                        </excludes>
                                    </filter>
                                </filters>
                            </configuration>
                        </execution>
                    </executions>
                </plugin>
            </plugins>
        </build>

    编写一个 java 类,继承 UDF,并重载 evaluate 方法

    import org.apache.hadoop.hive.ql.exec.UDF;
    
    /**
     * hive的自定义函数
     */
    public class ItcastFunc extends UDF{
        //重载
        public String evaluate(String input){
            return input.toLowerCase();//将大写字母转换成小写
        }
    
        public int evaluate(int a,int b){
            return a+b;//计算两个数之和
        }
    }

    打成 jar 包上传到服务器

    将 jar 包添加到 hive 的 classpath

      

    hive>add JAR /root/hivedata/udf.jar;

    创建临时函数与开发好的 java class 关联

    create temporary function udffunc as 'hive.udf.UDFFunc';//temporary表示为临时方法,当会话结束后失效;udffunc为hive中定义的函数名,‘hive.udf.UDFFunc’为自定义方法的全类路径

    在 hive中使用自定义的函数 

    select udffunc("ABC") from dual;//输出abc
    select udffunc(2,3) from dual;//输出5
  • 相关阅读:
    [CF 351B]Jeff and Furik[归并排序求逆序数]
    [置顶] 道德经之常与善人
    银联手机支付(.Net Csharp),3DES加密解密,RSA加密解密,RSA私钥加密公钥解密,.Net RSA 3DES C#
    SPOJ 375 (树链剖分+线段树)
    I.MX6 eMMC分区挂载
    I.MX6 android 4.2 源码下载
    I.MX6 android 源码下载
    Android 动态注册 亮屏、息屏广播
    Android 如何进入充电模式
    I.MX6 新版u-boot分析
  • 原文地址:https://www.cnblogs.com/jifengblog/p/9278972.html
Copyright © 2011-2022 走看看