Hive GenericUDF2 - 走看看

zoukankan html css js c++ java

Hive GenericUDF2
再来看一个分数统计的小例子。

在Hive中存在如下一张表：
[plain] view plain copy

hive> describe tb_test2;

OK

name    string

score_list  array<map<string,int>>

Time taken: 0.074 seconds

hive> select * from tb_test2;

OK

A   [{"math":100,"english":90,"history":85}]

B   [{"math":95,"english":80,"history":100}]

C   [{"math":80,"english":90,"histroy":100}]

Time taken: 0.107 seconds
编写genericUDF.
[java] view plain copy

package com.wz.udf;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.hive.ql.udf.generic.GenericUDF;

import org.apache.hadoop.hive.ql.exec.UDFArgumentException;

import org.apache.hadoop.hive.ql.exec.UDFArgumentLengthException;

import org.apache.hadoop.hive.ql.exec.UDFArgumentTypeException;

import org.apache.hadoop.hive.ql.metadata.HiveException;

import org.apache.hadoop.hive.serde2.lazy.LazyString;

import org.apache.hadoop.hive.serde2.lazy.LazyMap;

import org.apache.hadoop.hive.serde2.objectinspector.ObjectInspector;

import org.apache.hadoop.hive.serde2.objectinspector.ObjectInspector.Category;

import org.apache.hadoop.hive.serde2.objectinspector.ListObjectInspector;

import org.apache.hadoop.hive.serde2.objectinspector.MapObjectInspector;

import org.apache.hadoop.hive.serde2.objectinspector.StructObjectInspector;

import org.apache.hadoop.hive.serde2.objectinspector.StandardListObjectInspector;

import org.apache.hadoop.hive.serde2.objectinspector.ObjectInspectorFactory;

import org.apache.hadoop.hive.serde2.objectinspector.StructField;

import org.apache.hadoop.hive.serde2.objectinspector.PrimitiveObjectInspector;

import org.apache.hadoop.hive.serde2.objectinspector.primitive.PrimitiveObjectInspectorFactory;

import org.apache.hadoop.hive.serde2.objectinspector.primitive.StringObjectInspector;

import java.util.ArrayList;



public class helloGenericUDFNew extends GenericUDF {

     ////输入变量定义

     private ObjectInspector nameObj;

     private ListObjectInspector listoi;

     private MapObjectInspector mapOI;

     private ArrayList<Object> valueList = new ArrayList<Object>();

     @Override

     public ObjectInspector initialize(ObjectInspector[] arguments) throws UDFArgumentException {

          nameObj = (ObjectInspector)arguments[0];

          listoi = (ListObjectInspector)arguments[1];

      mapOI = ((MapObjectInspector)listoi.getListElementObjectInspector());

          //输出结构体定义

          ArrayList structFieldNames = new ArrayList();

          ArrayList structFieldObjectInspectors = new ArrayList();

          structFieldNames.add("name");

      structFieldNames.add("totalScore");



          structFieldObjectInspectors.add( PrimitiveObjectInspectorFactory.writableStringObjectInspector );

          structFieldObjectInspectors.add( PrimitiveObjectInspectorFactory.writableIntObjectInspector );



          StructObjectInspector si2;

          si2 = ObjectInspectorFactory.getStandardStructObjectInspector(structFieldNames, structFieldObjectInspectors);

          return si2;

     }



     @Override

     public Object evaluate(DeferredObject[] arguments) throws HiveException{

      LazyString LName = (LazyString)(arguments[0].get());

      String strName = ((StringObjectInspector)nameObj).getPrimitiveJavaObject( LName );



      int nelements = listoi.getListLength(arguments[1].get());

          int nTotalScore=0;

          valueList.clear();

          //遍历list

      for(int i=0;i<nelements;i++)

      {

               LazyMap LMap = (LazyMap)listoi.getListElement(arguments[1].get(),i);

               //获取map中的所有value值

           valueList.addAll(mapOI.getMap(LMap).values());

               for (int j = 0; j < valueList.size(); j++)

           {

                   nTotalScore+=Integer.parseInt(valueList.get(j).toString());

               }

          }

      Object[] e;

      e = new Object[2];

      e[0] = new Text(strName);

          e[1] = new IntWritable(nTotalScore);

          return e;

     }



     @Override

     public String getDisplayString(String[] children) {

          assert( children.length>0 );



          StringBuilder sb = new StringBuilder();

          sb.append("helloGenericUDFNew(");

          sb.append(children[0]);

          sb.append(")");



          return sb.toString();

     }

}
在Hive中执行，结果如下:
[plain] view plain copy

hive> add jar /home/wangzhun/hive/hive-0.8.1/lib/helloGenericUDFNew.jar;

Added /home/wangzhun/hive/hive-0.8.1/lib/helloGenericUDFNew.jar to class path

Added resource: /home/wangzhun/hive/hive-0.8.1/lib/helloGenericUDFNew.jar

hive> create temporary function hellonew as 'com.wz.udf.helloGenericUDFNew';

OK

Time taken: 0.016 seconds

hive> select hellonew(tb_test2.name,tb_test2.score_list) from tb_test2;

Total MapReduce jobs = 1

Launching Job 1 out of 1

Number of reduce tasks is set to 0 since there's no reduce operator

Starting Job = job_201312091733_0018, Tracking URL = http://localhost:50030/jobdetails.jsp?jobid=job_201312091733_0018

Kill Command = /home/wangzhun/hadoop/hadoop-0.20.2/bin/../bin/hadoop job  -Dmapred.job.tracker=localhost:9001 -kill job_201312091733_0018

Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 0

2013-12-09 22:31:22,328 Stage-1 map = 0%,  reduce = 0%

2013-12-09 22:31:25,354 Stage-1 map = 100%,  reduce = 0%

2013-12-09 22:31:28,390 Stage-1 map = 100%,  reduce = 100%

Ended Job = job_201312091733_0018

MapReduce Jobs Launched:

Job 0: Map: 1   HDFS Read: 99 HDFS Write: 18 SUCESS

Total MapReduce CPU Time Spent: 0 msec

OK

{"people":"A","totalscore":275}

{"people":"B","totalscore":275}

{"people":"C","totalscore":270}

Time taken: 21.7 seconds
查看全文

相关阅读:
Loadrunner初学
 loadrunner安装
 性能测试基础知识
 编程语言的基本套路
 Axure RP初学
 网络分层
 网络软件的组成
 C#MVC的基础知识
 xml的基本认识
 添加ASPCMS模板的步骤

原文地址：https://www.cnblogs.com/cxhfuujust/p/7553123.html