zoukankan      html  css  js  c++  java
  • Hive数据仓库基本概念

    1.基本概念

    数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持。数据仓库是存数据的,企业的各种数据都往里面存,主要目的是分析有效数据,后续会基于它产出供分析挖掘的数据。

    2.数据仓库的分层架构

    ------------恢复内容开始------------

    1.基本概念

    数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持。数据仓库是存数据的,企业的各种数据都往里面存,主要目的是分析有效数据,后续会基于它产出供分析挖掘的数据。

    2.数据仓库的分层架构

     3.Hive的概念

    Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能

    其本质是将SQL转换成MapReduce的任务进行运算,底层是由HDFS来提供数据的存储,说白了hive可以理解为一个将SQL转换成MapReduce的任务的工具。

    4.Hive的架构

     

     

     5.Hive的交互方式

    进入Hive的安装目录下的bin,目录,运行hive命令

     

     show databases:查看所有数据库

    cerate database if not exists mydatabase:如果mydatabase数据库不存在就创建

    use mydatabase:使用mydatabase数据库

    create table:创建表

    不进入Hive的客户端直接执行hive的hql语句

     或者将hql语句写成一个sql脚本,然后运行

  • 相关阅读:
    【题解】LOJ #6488 数表【FWT】
    【题解】[Comet OJ Contest #11 F] arewell【子集卷积】
    【CF757F】 Team Rocket Rises Again 【支配树】
    支配树学习笔记
    JS模拟实现题目(new debounce throwee 等)
    React生命周期
    js转义符
    CSS3中的transform转换属性
    animation动画
    flex
  • 原文地址:https://www.cnblogs.com/wangzhaojun1670/p/13530111.html
Copyright © 2011-2022 走看看