zoukankan      html  css  js  c++  java
  • 阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

    我对一些当下较为热门的概念做了一些梳理,其实想要了解区别,我觉得得先知道它们各自的定义。

    1、先说数据中台

    它的起源我就不说了,相信大家或多或少都看过这个有趣的故事:15年马云携高管访问supercell这个游戏公司,这个游戏公司为什么牛逼?就是因为它的员工不多,但是却造出了很多知名的游戏,原因就在于它的中台战略深入人心,如何像他们一样提高人效?这才是高管们关心的。

    回到国内,中台的概念就被造出来了,从起名可以看出来,是处于中间位置,连接前后的作用,最终的目的是提高员工和企业的效率。

    阿里事业部不下十几个,淘宝、天猫、 1688、聚划算、菜鸟物流,每个事业部都有独立的架构体系,对应各个的开发和运维,这会出现功能重复建设,数据格式不统一,口径不一致。

    中台的出现就是为了解决这些重复造轮子的情况,打通各个业务系统的数据,有些费时费力的代码,写过一遍了,为什么还要再写呢?此处@各研发。

    再拿某公司来说,很多人都觉得它是app工厂,造出了很多知名的产品如X音、X条等,但是他们的研发背后,肯定有一套,和阿里一样的,合理的数据中台体系。

    阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

    我想提一下数据中台的价值之一:数据服务化

    数据中台要能打通烟囱式的数据体系,避免重复开发,做到全域数据打通,构建公司级统一的数据仓库。同时,也提供更方便的数据访问方式:比如数据API、可视化访问、自助提取等。

    说到可视化,就不得不提一下企业的数据架构了:

    阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

    可视化一般是处于展示层或者应用层,你可以没有中台,但是你不能没有可视化,因为中台是为了研发方便,但是可视化就是为了老板和管理层的决策了,谁重要?

    市面上有相当多的可视化工具,成熟的也好,开源的也罢,很多很多,但这些大多是门槛挺高的工具,比如Echarts、Highchart等,或许它们在技术层面上很厉害,也很成熟,但是缺点也很明显:人群太少,只有懂技术的能用。

    我做可视化也有点经验,这么几个是比较实用的:

    (1)FineReport

    国内的一款报表工具,如果要论稳定性、适用性、决策性,它可谓是当仁不让,虽然定位是解决IT重复开发、企业数据孤岛的报表工具,但是还能做可视化大屏,你能想象吗?

    阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

    (2)FineBI

    国内BI的前者,并且已经在这个位置上很多年了。

    简洁明了的数据分析工具,也是我个人最喜欢的可视化工具,零代码零代码!!!

    阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

    (3)Tableau

    阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

    国外的工具,BI领域的第一,但是论价钱的话....很多企业都会放弃的,而且就我认识的人来看,有很多用了Tableau然后放弃的,最终回到了国产BI,只能说各有选择吧。

    2、再来说说数据仓库

    在我看来,数据仓库就是用来进行数据分析的,因为企业数据量大到一定程度之后,说明该企业的规模也是非常大的,数据库在进行大量数据查询的时候效率较低。

    如果每次分析都从数据库里取数,那么会非常麻烦,所以就有了数据仓库,每隔一段时间把数据库里面的所有数据放到数据仓库里分析。

    数据仓库整合多个数据源,进行多维的分析,其架构一共有4层:

    阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

    3、两者的区别

    先对两者的概念进行一个简单的总结:

    • 数据仓库是利用数据平台提供的计算和存储能力,在一套方法论指导下建设的一整套的数据表
    • 数据中台包含了数据平台和数据仓库的所有内容,将其打包,并且以更优雅以及更产品化的方式对外提供服务和价值

    然后你就会发现:数据中台其实包含数据仓库,数据中台可以将企业数据仓库建设的投入价值进行最大化。再来扩大一点,说说和BI的关系吧,数据仓库是BI的基石,数据仓库为BI系统提供良好的数据基础。

    数据仓库的主要场景是支持管理决策和业务分析,而数据中台则是将数据服务化之后提供给业务系统,目标是将数据能力渗透到各个业务环节,不限于决策分析类场景。

    阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

    数据中台也可以将已建好的数据仓库当成数据源,对接已有数据建设成果,避免重复建设。当然也可以基于数据中台提供的能力,通过汇聚、加工、治理各类数据源,构建全新的离线或实时数据仓库。

    不过数据中台更加偏重于数据使用,较之于传统数据仓库的数据组织形式,数据中台的数据覆盖范围更广、数据关系和处理模式更复杂、数据使用方式更灵活,因而给企业内部数据使用人员的能力带来较大挑战。

    关注我,并转发该文章,回复“数据”,即可获得上述数据工具和中台、数仓等干货!

  • 相关阅读:
    阿里Canal中间件的初步搭建和使用
    深入理解Java String类
    深入理解Java中的String
    Docker 容器数据卷(挂载)
    在docker容器下利用数据卷实现在删除了mysql容器或者镜像的情况下恢复数据
    EFK(Elasticsearch+Filebeat+Kibana)收集容器日志
    Docker 容器日志占用空间过大解决办法
    四种软件架构,看看你属于哪个层次
    Kubernetes 如何只授予某一 Namespace 的访问权限
    Docker实验Docker的网络配置
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13325531.html
Copyright © 2011-2022 走看看