2021.11.18（hive架构原理） - 走看看

zoukankan html css js c++ java

2021.11.18（hive架构原理）

今日学习内容：

Hive 架构原理：

1）用户接口：Client CLI（command-line interface）、JDBC/ODBC(jdbc 访问 hive)、WEBUI（浏览器访问 hive）

2）元数据：Metastore 元数据包括：表名、表所属的数据库（默认是 default）、表的拥有者、列/分区字段、表的类型（是否是外部表）、表的数据所在目录等；默认存储在自带的 derby 数据库中，推荐使用 MySQL 存储 Metastore

3）Hadoop 使用 HDFS 进行存储，使用 MapReduce 进行计算。

4）驱动器：Driver

（1）解析器（SQL Parser）：将 SQL 字符串转换成抽象语法树 AST，这一步一般都用第三方工具库完成，比如 antlr；对 AST 进行语法分析，比如表是否存在、字段是否存在、SQL 语义是否有误。

（2）编译器（Physical Plan）：将 AST 编译生成逻辑执行计划。

（3）优化器（Query Optimizer）：对逻辑执行计划进行优化。

（4）执行器（Execution）：把逻辑执行计划转换成可以运行的物理计划。对于 Hive 来说，就是 MR/Spark。

查看全文

相关阅读:
CPT104-labs
Java-数据结构-ArrayList
INT104-lab13[Parzen Window Method][此方法无数据集划分]
INT104-lab12 [KNN Algorithm][lambda表达式]
INT104-lab11 [聚类] [iris数据集] [K-means Algorithm]
Nginx配置https兼容http
JS获取整个网页html代码
 nginx重启生效conf文件的修改
 WampServer
在win10系统中，开启hyper-v要满足下列条件

原文地址：https://www.cnblogs.com/marr/p/15579137.html

Copyright © 2011-2022 走看看