zoukankan      html  css  js  c++  java
  • hive和关系型数据库

          1)hive和关系型数据库存储文件的系统不同。  hive使用hdfs(hadoop的分布式文件系统),关系型数据库则是服务器本地的文件系统;


           2)hive使用的计算模型是mapreduce,而关系型数据库则是自己设计的计算模型。


           3)hive是为海量数据做数据挖掘设计的,实时性差;而关系型数据库是为实时查询的业务进行设计的。


           4)hive很容易扩展自己的存储能力和计算能力,这个是继承hadoop的,而关系型数据库在这方面相对较差。而数据库由于 acid 语义的严格限制,扩展行非常有限。

           5)hive中不支持对某个具体行的操作,对数据的操作只支持覆盖原数据和追加数据;hive也不支持事务和索引。 ---------已经都支持了吧


           6)hive在加载数据时候和关系数据库不同。

        hive:检查数据格式的操作是在查询操作时候执行,这种模式叫“读时模式"

        关系数据库:“写时模式”,数据加载时候对数据模式进行检查校验的操作。

        当我们的数据是非结构化,存储模式也是未知时候,关系数据操作这种场景就麻烦多了,这时候hive就会发挥它的优势。


           7)执行延迟。

        在利用 mapreduce 执行 hive 查询时,也会有较高的延迟。相对的,数据库的执行延迟较低。
              

  • 相关阅读:
    对接某款商城系统[5]商城商品多级价格处理
    利用DelegatingHandler实现Web Api 的Api key校验
    采用Lambda表达式快速实现实体模型对象转换到DTO
    驱蚊器翁
    批量测试网络关系的小脚本
    jboss7访问日志功能及使用goaccess工具分析
    jetty使用jndi数据源
    sping junit test
    Too many open files解决方案及原理
    jboss7的JAX-WS客户端
  • 原文地址:https://www.cnblogs.com/qiuhong10/p/7744120.html
Copyright © 2011-2022 走看看