zoukankan      html  css  js  c++  java
  • Superset配置impala数据源

    1.安装impyla

    pip install impyla 
    

     2.在superset页面配置如下,此时impala是有kerberos认证的

    impala://xxxx:xx/default?auth_mechanism=GSSAPI&kerberos_service_name=impala
    

    如果遇到下面的问题,是thrift-sasl版本过高

    The error message returned was:
    'TSocket' object has no attribute 'isOpen'
    

     降级为0.2.1版本就可以

    pip list | grep thrift-sasl
    thrift-sasl            0.3.0      
    pip install thrift-sasl==0.2.1
    

    测试,ok

    查询

    当将thrift-sasl从0.3.0降级为0.2.1之后,连接hive会报

    from pyhive import hive ImportError: cannot import name 'constants'
    

    解决方法是将原来hive的uri从

    hive://xxx:xxx/default?auth=KERBEROS&kerberos_service_name=hive
    

     修改为

    impala://xxx:xxx/default?auth_mechanism=GSSAPI&kerberos_service_name=hive
    

    同时附上impala和hive查询的时间对比,impala要快很多

    hive

    impala

    其中city为array,在impala中不能使用select语句来查询,因为impala中select语句只支持标量

    如果要在impala中查询array中的数据,需要这么查

    select * from default.arraydemo, default.arraydemo.city
    

    结果,这是将array中的数据进行了展平

  • 相关阅读:
    Vasya And Password(CodeForces
    Romaji (CodeForces
    Sorting a Three-Valued Sequence(三值的排序)
    Factorials 阶乘
    Factorial(hdu 1124)
    EXTENDED LIGHTS OUT
    kali更换root默认登陆
    api-ms-win-crt-string-l1-1-0.dll丢失解决办法
    vim 缩进
    bash: cd: .ssh/: Permission denied
  • 原文地址:https://www.cnblogs.com/tonglin0325/p/11200969.html
Copyright © 2011-2022 走看看