zoukankan      html  css  js  c++  java
  • HBASE、HBASE和phoenix的简单认识

    一般大数据的工具包都是tar包,直接下载下来,然后进行解压缩,修改配置文件,最后执行对应的sh文件。

    1.phoenix

      phoenix:JAVA语言编写,查询引擎会将SQL查询语句转化成一个或多个HBase Scanner,且并行执行生成标准的JDBC结果集。phoenix使用标准JDBC API代替HBase客户端API来创建表、插入数据和查询HBase数据。我可以理解为phoenix是HBASE的一个框架,通过使用标准的SQL语句来操作HBASE。

    phoenix语法:https://phoenix.apache.org/language/index.html

    phoenix函数:https://phoenix.apache.org/language/functions.html

    phoenix支持的数据类型:https://phoenix.apache.org/language/datatypes.html

    phoenix参考语句:

    UPSERT INTO TEST VALUES('foo','bar',3);
    UPSERT INTO TEST(NAME,ID) VALUES('foo',123);
    UPSERT INTO TEST(ID, COUNTER) VALUES(123, 0) ON DUPLICATE KEY UPDATE COUNTER = COUNTER + 1;
    UPSERT INTO TEST(ID, MY_COL) VALUES(123, 0) ON DUPLICATE KEY IGNORE;
    SELECT * FROM TEST LIMIT 1000;
    SELECT * FROM TEST LIMIT 1000 OFFSET 100;
    SELECT full_name FROM SALES_PERSON WHERE ranking >= 5.0
        UNION ALL SELECT reviewer_name FROM CUSTOMER_REVIEW WHERE score >= 8.0 

    2.HBASE

    HBASE是一个高可靠、高性能、面向列、可伸缩的分布式存储系统,与HDFS一样都是分布式存储系统,而且HBASE还是利用HADOOP HDFS作为文件存储系统,利用ZK作为协同服务。之所以有HBASE的存在,目的是弥补HDFS只能存储和MP不能进行实时计算的问题。

    比如HBASE的操作:

    • 下载hbase包:hbase-0.95-SNAPSHOT.tar.gz
    • 执行hbase压缩后的包:./bin/start-hbase.sh
    • 执行hbase shell文件:./bin/hbase shell
    create 'test', 'cf'
    list 'test'
    put 'test', 'row1', 'cf:a', 'value1'
    put 'test', 'row2', 'cf:b', 'value2'
    put 'test', 'row3', 'cf:c', 'value3'
    put 'test', 'row4', 'cf:d', 'value4'
    scan 'test'
    get 'test', 'row1'
    disable 'test'
    enable 'test'
    
    

    HBASE中文:http://abloz.com/hbase/book.html#datamodel

    HBASE官网:http://hbase.apache.org/1.4/book.html

    3.HIVE

    Hive:提供了一系列的工具,可以用来进行数据提取转化加载(ETL),Hive定义了简单的类SQL查询语言,称为QL,它允许熟悉SQL的用户查询数据。本质上讲,Hive是一个SQL解析引擎,有一套映射工具metastore,可以把SQL转换为MapReduce中的job,可以把SQL中的表、字段转换为HDFS中的文件(夹)以及文件中的列,存放在derby、mysql中。我所理解的HIVE的这样一个功能就实现了把放在hadoop下的数据与关系型数据展示上联系起来了。

    HIVE更详细的资料:https://www.cnblogs.com/wendyw/p/11389971.html

    4.HBASE、HIVE、phoenix三者之间的关系

     5.python之三方库HappyBase

    通过python的三方库happyBase,可以对hbase进行连接使用。

    happybase三方库参考文档:https://happybase.readthedocs.io/en/latest/user.html

  • 相关阅读:
    Java calendar类学习笔记
    Anaconda 学习笔记
    第八周作业
    第七次作业
    第六周作业
    第五次作业
    用户调研方法之焦点小组
    第三周作业
    软件工作量的评估方法有哪些
    软件质量保证与测试(--作业--)
  • 原文地址:https://www.cnblogs.com/wendyw/p/12839626.html
Copyright © 2011-2022 走看看