zoukankan      html  css  js  c++  java
  • 熬夜做出的数据可视化,却被领导臭骂,只因这个......

    ​作为一名苦逼的数据可视化人,在公司里不仅要承担业务需求分析的工作,天天取数做报告,还得经常熬夜加班做可视化,赶上领导指示甚至要忙大屏项目,最后却常常被领导臭骂,大家应该都听过领导这几句吐槽:

    “不就是一张可视化大屏嘛?下班之前做不出来?”

    “这个可视化怎么这么丑?能不能让这个图表既大点、又小点?”

    “你做的这个可视化有什么用?”

    而像我这种摸爬滚打十年的数据分析师,有时候辛苦熬夜做出可视化,哪怕是做出了下面这样,满心欢喜交给领导时也会被骂,被嫌弃的多了我就开始自省:为什么领导不喜欢我做的可视化?

    熬夜做出的数据可视化,却被领导臭骂,只因这个......

    后来我意识到可视化的工作是为了数据服务的,但是看数据的是人,一个成熟的数据分析师要懂得避开这些可视化的坑,优化需求方的体验程度,才能不被领导嫌弃。因此我总结出了下面的“否认三问”,在进行可视化项目之前问一下自己这三个问题,就能基本上规避很多问题:

    非要把数据可视化吗?所有需求都要满足吗?用什么来做可视化呢?

    熬夜做出的数据可视化,却被领导臭骂,只因这个......

    你做的这个有什么用? VS 非要把数据可视化吗?

    我们都知道数据可视化的目的是为了借助图形化的手段,把数据通过直观方式传达出去,但是我们常常犯的一个错误,就是无论遇到什么数据,都要进行可视化。

    也就是把可视化当做了手段,而不是目的。所有的数据都需要结合业务,脱离业务就没必要可视化。

    其实很多数据和项目都是没有必要进行可视化的,举个例子,领导觉得最近某个门店的销售额下降严重,想让你用数据分析一下原因。你从数据库中取数之后,想都不想把这个门店的销售额、订单量、存货量、客流量等等一股脑拉了出来,然后开始做可视化,最后把所有数据放到一起,谁看了不头大?

    那么应该怎么做呢?正确的做法应该是按照业务思维的方式分解数据,然后再对症下药进行可视化。比如既然是要分析门店的销售额,就要分解为两部分:来客数与客单价,商品结构

    来客数与客单价就要分析每天门店的客单交易情况,显示门店是否遇到了客单下滑的情况;然后进行商品结构的分析,找出单品数多而销量差的商品,优化门店的商品结构;

    清晰了这两点目标之后,再取出客单数、客单价、交易量、品类销量等数据进行可视化,如下图:

    熬夜做出的数据可视化,却被领导臭骂,只因这个......

    这样做出来的可视化才是领导想要的,关于业务数据分析,我这里介绍一种快速了解数据与业务以开展进一步的探索与分析的方法,叫“5W2H法”。

    1. WHAT,这是关于什么业务的什么事?数据所描述的业务主题是什么?
    2. HOW,即如何采集的数据?无网络状态下是如何处理的?
    3. WHY,为什么搜集此数据?我们想从数据中了解什么?数据分析的目标是什么?
    4. WHEN,是何时段内的业务数据?
    5. WHERE,是何地域范围内的业务数据?
    6. WHO,谁搜集了数据(Who)?在企业内可能更关注是来自哪个业务系统。
    7. HOW MUCH,各种数据有多大的量,足够支持分析吗?

    如果七个问题中有一个答复不能令人满意,则表示这方面有改进余地。

    你做的怎么这么丑? VS 所有需求都要满足吗?

    当需求方提出多种要求时,你是不是经常听到“所有需求的都要做”这句话呢?当被要求优先考虑某些功能时,往往会产生严重的不安全感,并担心未来的各种情况可能无法得到解决。所以企业的第一个可视化项目,会有比较多花里胡哨的需求。

    数据可视化最重要的功能是发挥咨询作用,帮助减少功能列表,只留下最关键的功能。尽管从技术角度上来讲,屏幕空间是无限制的,但它对数据密度的施加是有限制的,例如“一张不可滚动的屏幕”。

    所以我们要剔除掉不需要的需求,用简单的三个步骤就可以选择合适的图表类型:一看数据类型,二看数据维度,三看要表达的内容

    • 分析定量数据和定量数据之间的相关性:散点图
    • 分析分类数据和分类数据之间的相关性:马赛克图
    • 分析分类数据和定量数据之间的相关性:柱形图或箱线图

    举几个例子来说明大家可能就明白了。

    首先来看一个散点图的例子,比如我要分析一下汽车每加仑行驶的英里数和汽车重量之间的关系,因为两个都是定量数据,那么我们就应该选择散点图:

    熬夜做出的数据可视化,却被领导臭骂,只因这个......

    怎么做的这么慢? VS 用什么来做可视化?

    关于数据可视化我们所见过许多眼花缭乱的效果,大部分是用华丽的视效堆叠起来博人眼球,然而经不起业务价值的推敲,而且还会浪费分析人的很多时间,有时候不得不加班加点地做可视化,除了上面提到的两点原因之外,还有一个重要原因是不懂得利用工具。

    举个例子,不说取数,就用我们最常用的excel来做一份简单的仪表盘时,需要用到表格函数、AVERAGEIF函数、INDEX函数、MATCH函数等十几个函数,以及堆积条形图、簇状柱形图、信息图、带数据标记的折线图、簇状条形图等几种图型,就算是熟练的excel大能估计也要做上半个小时。

    这还只是不涉及复杂勾稽关系的简单可视化,如果是要做一份完整可视化报告呢?而且很多人对于excel的函数、透视表、VBA等都不熟练,做起来自然很慢。

    熬夜做出的数据可视化,却被领导臭骂,只因这个......

    而如果能够掌握一些专业的可视化工具,起码能够减少一半的工作时间和重复量,比如FineBI、python、tableau等,这些都属于数据分析工具中比较适合新手的可视化帮手。

    比如,FineBI对于数据的图表设置相对来说比较简单,进行数据字段的拽拖即可,同时还有一些数据的查询操作等,也是只需要拖拽空间即可,基本上不需要函数以及编程,使用中要注意下面三点:

    1. 在做数据分析的时候,往往需要多个表,多个字段组合生生成,这个时候可以将数据表合并,这样相对应的字段就统一了。
    2. 首页的模板为默认模板,可以在系统设置中,直接更换链接。
    3. 该软件还有很多其他的功能,可以直接上论坛看教程。

    最后

    欢迎关注我的公众号“数据分析不是个事儿”,里面超级多的干货~

  • 相关阅读:
    Python GUI编程(Tkinter)——Label and Button
    第一章——正则表达式(特殊符号和字符)
    最近用到的Blender相关技术总结
    第一章—正则表达式(简介/动机)
    发个随笔纪念Manim配置成功
    JUC并发工具的使用和原理
    线程启动与终止原理
    cpu缓存一致性
    布隆过滤器
    对象并不一定都是在堆上分配内存(逃逸分析)
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13325692.html
Copyright © 2011-2022 走看看