impala为什么比hive快 - 走看看

zoukankan html css js c++ java

impala为什么比hive快
Impala自称数据查询效率比Hive快几倍甚至数十倍，它之所以这么快的原因大致有以下几点：
- 全新的执行引擎（不是Mapreduce）。
- 在执行SQL语句的时候，Impala不会把中间数据写入到磁盘，而是在内存中完成了所有的处理。
- 使用Impala的时候，查询任务会马上执行而不是生产Mapreduce任务，这会节约大量的初始化时间。
- Impala查询计划解析器使用更智能的算法在多节点上分布式执行各个查询步骤，同时避免了sorting和shuffle这两个非常耗时的阶段，这两个阶段往往是不需要的。
- Impala拥有HDFS上面各个data block的信息，当它处理查询的时候能够在各个datanode上面更均衡的分发查询。
- 另外一个关键原因是，Impala为每个查询产生汇编级的代码，当Impala在本地内存中运行的时候，这些汇编代码执行效率比其它任何代码框架都更快，因为代码框架会增加额外的延迟。
查看全文

相关阅读:
jsp学习之——关于请求转发和重定向的形象理解
 java多线程学习之——多线程中几种释放锁和不释放锁的操作
 DBUtils学习之——使用ResultSetHandler接口的各个实现类实现数据库的增删改查
 java网络编程学习之——构建基于多线程的网络通信模型1
web后端学习过程中技巧总结（持续更新。。。）
关于表单form元素中onsubmit事件处理机制的认识
 Java小案例——使用双重for循环实现杨辉三角的输出
 Android工具大杂烩
 基于上一篇AS项目依赖库问题的优化解决方案
 Gradle脚本打包AndroidStudio依赖库的问题

原文地址：https://www.cnblogs.com/zhangzhen894095789/p/11586428.html

Copyright © 2011-2022 走看看