zoukankan      html  css  js  c++  java
  • Druid简单介绍

    什么是druid

    • druid是一个为OLAP查询需求而设计的开源大数据系统,druid提供低延时的数据插入,实时的数据查询
    • druid使用Java开发,基于Jetty提供http rest服务,也提供了Java/Python等语言的工具包
    • druid是一个集群系统,使用zookeeper做节点管理和事件监控

    druid的特点

    • druid的核心是时间序列,把数据按照时间序列分批存储,十分适合用于对按时间进行统计分析的场景
    • druid把数据列分为三类:时间戳、维度列、指标列
    • druid不支持多表Join
    • druid中的数据一般是使用其他计算框架(Spark等)预计算好的低层次统计数据
    • druid执行其擅长的查询类型时,从数十亿条记录中过滤、汇聚只有亚秒级延迟
    • druid支持水平扩展,查询节点越多、所支持的查询数据量越大、响应越快
    • druid完美支持的查询类型比较简单,查询场景限制较多,一些常用的SQL(groupby等)语句在druid里运行速度一般
    • druid支持低延时的数据插入,数据实时可查,不支持行级别的数据更新

    druid为什么快

    • druid在数据插入时按照时间序列将数据分为若干segment,支持低延时地按照时间序列上卷,所以按时间做聚合效率很高
    • druid数据按列存储,每个维度列都建立索引,所以按列过滤取值效率很高
    • druid用以查询的Broker和Historical支持多级缓存,每个segment启动一个线程并发执行查询,查询支持多Historical内部的线程级并发及Historical之间的进程间并发,Broker将各Historical的查询结果做合并

    druid的高可用性

    1. MetaStore挂掉:无法感知新的Segment生成,不影响老数据
    2. Indexing Service挂掉:无法执行新的任务,新数据无法摄入,不影响查询
    3. Broker挂掉:本Broker节点不能查询,其他节点Broker继续服务,不影响数据摄入
    4. Historical挂掉:Coordinator Node重分配该节点上segment到其它节点
    5. Coordinator挂掉:Segment不会被加载和删除,选举新leader
    6. Zookeeper挂掉:无法执行新的任务,新数据进不来;Broker有缓存

    -----------------------------------------------------------------------------------------------感谢到访!期待您的下次光临!

  • 相关阅读:
    七牛上传图片视频demo
    JavaScript数组及相关方法
    Math对象产生随机数一个小应用
    JavaScript 开发进阶:理解 JavaScript 作用域和作用域链
    HTML5 中的meter 标签的样式设置
    jQuery报错:Uncaught ReferenceError: $ is not defined
    每次打开office 2013都提示配置进度,必须得等他下完然后重启,重启完了在打开,还是提示配置进度,怎么解决
    CSS小技巧收藏
    DOM中元素节点、属性节点、文本节点的理解13.3
    (转)如果知道dll文件是面向32位系统还是面向64位系统的?
  • 原文地址:https://www.cnblogs.com/varchar-pig/p/14238675.html
Copyright © 2011-2022 走看看