zoukankan      html  css  js  c++  java
  • UDF返回数据的例子

    spark = SparkSession.builder. 
        appName("wk_stg_10650018_cs"). 
        enableHiveSupport(). 
        config("spark.debug.maxToStringFields", "100"). 
        getOrCreate()
    
    df = spark.createDataFrame([('a', [1, 2, 3],['x','y']), ('b', [5, 2, 3],['x','y'])], ['id', 'c1','c2'])
    df.createOrReplaceTempView('t1')
    
    def gen(begin,end):
        return list(range(begin,end))
    # spark.udf.register(
    'gen', gen, ArrayType(IntegerType())) spark.sql('select id, gen(1,3) as arr from t1').createOrReplaceTempView('t1') spark.sql( "select id,c" " from t1" " lateral view explode(arr) A as c" ).show()
  • 相关阅读:
    I/O模型
    同步异步与协程
    GIL(全局解释器锁)
    解决pycharm启动慢
    操作系统发展史
    TCP和UDP
    粘包问题
    网络编程
    异常
    常用函数汇总
  • 原文地址:https://www.cnblogs.com/muyue123/p/13865002.html
Copyright © 2011-2022 走看看