zoukankan      html  css  js  c++  java
  • hive与hbase整合方式和优劣

    分别安装hive 和 hbase 

    1、在hive中创建与hbase关联的表

    create table ganji_ranks (row string,num string)
    STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
    WITH SERDEPROPERTIES
    ("hbase.columns.mapping" = ":key,info:num") TBLPROPERTIES ("hbase.table.name"="ganji_rankings");

    2、可以在hive中使用hsql 来插入数据并同时在hbase中也可以scan到

    insert into table ganji_ranks select a,b,c from tablename where and/or ;

    3、可以在hbase中使用来插入数据,支持更新,插入同样rowkey的数据,最新的数据会覆盖前面一条

     put 'ganji_ranking',a,vb,c .....

    4、如果需要清空表,在hbase中truncate 'tablename' 即可

    5、如果需要删除表,hbase也可,hive也可以,在hive之中删除,hbase的表也会随之删除,在hbase中删除之前 需要 :1)、disable 'tablename' 2)、 drop 'tablename'      

    优势:方便统计,查看,查询核对   在hive中,因为如果有中文之类的,hbase看不懂,还需要自己写方法翻译,有时候通过hive计算的结果插入挺方便

    劣势:hbase创建表的时候很多自定义的东西实现不了,而且hive中的表不支持修改,hbase表名如果修改了,hive会查不到hbase数据

    好了,就这样!

  • 相关阅读:
    VS扩展开发 二 从示例程序出发
    VS扩展开发 一 导航
    CLR笔记 二 函数调用
    使用C#调用C++类库
    C#编程常用工具总结
    CLR笔记 一 概述
    C#工程中 使用targets和props实例
    VS C++工程的静态库引用问题
    C#高级编程笔记(三)
    (转)如何让CPU的使用率一直在50%
  • 原文地址:https://www.cnblogs.com/tnsay/p/5783815.html
Copyright © 2011-2022 走看看