Hive之 hive架构 - 走看看

zoukankan html css js c++ java

Hive之 hive架构
Hive架构图

主要分为以下几个部分：
- 用户接口，包括命令行CLI，Client，Web界面WUI，JDBC/ODBC接口等
- 中间件：包括thrift接口和JDBC/ODBC的服务端，用于整合Hive和其他程序。
- 元数据metadata存储，通常是存储在关系数据库如 mysql, derby 中的系统参数
- 底层驱动：包括HiveQL解释器、编译器、优化器、执行器（引擎）。
- Hadoop：用 HDFS 进行存储，利用 MapReduce 进行计算。
1. 用户接口主要有三个：CLI，Client 和 WUI。其中最常用的是 CLI，Cli 启动的时候，会同时启动一个 Hive 副本。Client 是 Hive 的客户端，用户连接至 Hive Server。在启动 Client 模式的时候，需要指出 Hive Server 所在节点，并且在该节点启动 Hive Server。 WUI 是通过浏览器访问 Hive。
2. Hive 将元数据存储在数据库中，如 mysql、derby。Hive 中的元数据包括表的名字，表的列和分区及其属性，表的属性（是否为外部表等），表的数据所在目录等。
3. 解释器、编译器、优化器完成 HQL 查询语句从词法分析、语法分析、编译生成执行计划、优化以及生成最佳执行计划。生成的查询计划存储在 HDFS 中，并在随后有 MapReduce 调用执行。
4. Hive 的数据存储在 HDFS 中，大部分的查询由 MapReduce 完成（包含 * 的查询，比如 select * from tbl 不会生成 MapRedcue 任务）。
查看全文

相关阅读:
psacct监视用户执行的命令,如cpu时间和内存战胜,实时进程记账
 iostat,mpstat,sar即时查看工具，sar累计查看工具
 sysstat服务负载统计,如CPU占有率，网络使用率，磁盘速度
 linux top命令VIRT,RES,SHR,DATA的含义
 lsof查看进程打开了哪些文件目录套接字
 linux系统监控常用工具
 Linux系统维护修复模式
 centos单用户模式：修改ROOT密码和grub加密
 Linux系统启动过程介绍
 Android原生APP内分享

原文地址：https://www.cnblogs.com/andy6/p/7545019.html

Copyright © 2011-2022 走看看