Kylin 技术架构（三）

zoukankan html css js c++ java

Kylin 技术架构（三）
Kylin 技术架构图

Kylin 系统可以分为在线查询和离线构建两部分

离线构建
- 数据源目前主要是 Hadoop、Hive、Kafka和 RDBMS，其中保持着待分析的用户数据
- Cube Build Engine（构建引擎）从数据源中抽取数据，并构建 Cube
- 数据以关系表的形式输入，且必须符合星形或雪花模型
- 用户可以新选择使用 MapReduce 或 Spark 进行构建
- 构建后的 Cube 保存在存储引擎中（目前 HBase 是默认的存储引擎）
在线查询
- 用户可以通过各种接口方式向 Kylin 发送 SQL 进行查询分析
- 无论哪种接口方式，最终 SQL 都会来到 REST 服务层，再转交给查询引擎进行处理
- SQL 语句是基于数据源的关系模型书写的，而不是 Cube（Kylin 在设计时刻意对查询用户屏蔽 Cube 的概念）
- 分析师只需要理解简单的关系模型就可以使用 Kylin，没有额外的学习门槛（传统的 SQL 应用也很容易迁移）
- 查询引擎解析 SQL，生成基于关系表的逻辑执行计划，然后将其转译为基于 Cube 的物理执行计划，最后查询预计算生成的 Cube 产生结果（整个过程不访问原始数据源）
Kylin 使用流程
- 定义数据集上的一个星形或雪花形模型
- 在定义的数据表上构建cube
- 使用标准 SQL 通过 ODBC、JDBC 或 RESTFUL API 进行查询，仅需亚秒级响应时间即可获得查询结果
作者：Binge

出处：http://www.cnblogs.com/binbingg/

本文版权归作者和博客园共有，转载必须给出原文链接，并保留此段声明，否则保留追究法律责任的权利。
查看全文

相关阅读:
sql server 索引总结一
 公用表表达式(CTE)
解决Setting property 'source' to 'org.eclipse.jst.jee.server的问题
 python测试开发django-2.templates模板与html页
 python测试开发django-1.开始hello world!
pytest文档28-重复执行用例（pytest-repeat）
pytest文档27-pytest分布式执行（pytest-xdist）
pytest文档26-运行上次失败用例(--lf 和 --ff）
pytest文档25-conftest.py作用范围
 python接口自动化11-post传data参数案例

原文地址：https://www.cnblogs.com/binbingg/p/14917287.html

Kylin 技术架构（三）

Kylin 技术架构图

离线构建

在线查询

Kylin 使用流程