zoukankan      html  css  js  c++  java
  • 数据分析的三层需求

    文 | 王佳东fr

    本文出自:知乎专栏《撩撩数据吧》——关于数据分析

    为什么有的报表好用,有的报表不好用,有的企业会做一堆乱七八糟的报表,最近经常会思考这些问题。

    有人说数据分析,为了开源节流,这个没有错,今天我从另外一个角度解读。数据分析,是为了应对风险(说明:风险与机会是一起的。PMI中将其共同列为风险管理,本文所有风险与机会同义),开源节流的每一次操作每一个节点,也是风险。

    企业经营,风里来雨里去,免不了碰到大大小小的机会和风险,抓住机会躲避风险是每个企业以及个人的毕生追求。

    PMI中将风险归为以下几类:

    • 已知的已知风险
    • 未知的已知风险
    • 未知的未知风险。

    本文将数据分析,也归纳为三层需求

    第一层需求:应对已知的已知风险

    可以将这一层需求看作为被动使用的数据,拿零售行业的场景举例:

    采购员要进行采购,没有数据作为参考,只能进行盲目采购,那商店的缺断货、商品积压的风险一定出现。所以采购员需要通过数据查看各类商品的销售情况、库存情况、可售天数情况进行判断,以此决定采购需求,避免错误的商品采购所导致的商品缺断货、高库存等风险。此为通过数据来应对已知的已知风险。

    对于企业之中,这类的应用特别多,多到部分企业会忽略这是一种数据分析的应用。企业中常用的业务系统比如erp等软件系统,也会自带一些简单的数据查看类报表,其作用也是很大程度上来应对这一类风险。

    但是,从另一个角度去看,这类风险的应对也有很大的优化空间:

    1. 风险应对的效率:提升风险应对的效率,是提升应用标准化的一个体现,当一个应用难以使用时,容易造成人员惰性,取巧而放弃使用,从而提高了风险发生的概率。
    2. 复杂的已知的已知风险的应对:绝大部分企业并没有将数据覆盖所有的已知风险,举例:新品的引进,新品的引进为商店带来新的盈利点,但是错误的引进甚至会带来负面效应。大部分企业的新品引进并没有一个很好的方案来应对:通过数据进行品类关联并对比,可以看出本店铺对于市场上销量靠前的商品的缺货情况,本店已有商品的市场占有情况,从而可以优化新品引进的策略。这一类的应用还有很大的空间,这也就是为什么很多企业乐于同行之间的交流,希望彼此可以互通有无,发现类似数据场景的应用。

    第二层需求:应对未知的已知风险

    这一类数据一般为主动使用的数据,更多的是周期性使用的数据,常见的比如领导们常看的日报表、周报表等。

    企业的风险发生的概率是分布在每一天的,但是它每一天都可能发生也可能不发生,例如部分员工的消极怠工、部分商品的质量异常、个别门店突然面临的对手竞争等。这一类风险当然是希望在发生的最短时间内就可以发现并且应对。所以企业中产生了大量的这一类型的报表需求。

    这类报表也很常见,但是他们价值的体现不如第一层需求类来的直接,这一类报表经常被浏览,但大部分情况是没有发现风险的,所以有时会产生一种这类报表没什么用的感觉。

    在我们所遇到的项目中,这类需求报表占比是很多的,也是争议最大的。领导层所需要看的日/周/月报类报表相对还好,毕竟是每天都会有人看,并且作为企业数据监督和追踪的一种形式。

    此外,还会有很多分析类的报表也属于这一层级,比如商品的价格带分析:找到某类商品的价格点,对比销售高点或销量高点,从而发现可能的商品价格分布的不合理或者货架摆放位置的不合理(价格点商品附近陈列丰富的商品可以给顾客带来商品丰富的感觉)。进一步调整商品价格分布以应对商品陈列或者价格分布的风险(机会)。

    这类报表的应用难度比较大,因为经验或者知识储备的不同,对风险的认知和识别能力不同。同样以上面的价格带分析报表为例,其目的为应对陈列、商品价格分布、商品引进/采购、目标活动人群选择的风险。但是使用报表的业务人员没有形成对这些风险(机会)的认知,就造成了缺乏对该报表的数据解读能力,该报表便成为了一个花瓶报表,价值无法得到体现。

    针对这一类报表,我的建议是场景化,让每一张报表背后都有它的风险机会描述,当自我不能解读的报表,也就不要指望业务可以解读并使用,并不是将一堆的指标都进行展示就能产生价值,它于落地的应用还相隔甚远。

    第三层需求:应对未知的未知风险

    这类需求近些年来大量出现,大数据概念被大多数人所重视也很大程度上是因为这一类需求。

    风险的不可预测性使得大量人群希望通过技术的手段来帮助识别和发现风险。比如很多人希望通过聚类这类算法的应用,来形成用户画像,发现自己之前无法发现的特性,或者通过对商品关联的挖掘,发现未知的商品关联关系,从而调整商品布局以发现巨大的商机,比如“啤酒与尿布”(不知真伪)。

    但是这类需求实现难度巨大,目前还属于少数互联网公司的专利,对于大多数企业尤其是传统企业而言,其实现成本是难以接受的,个别数据乙方可能会以此为诱饵进行宣讲,但就我所了解到的还难以形成很好的应用。

    但是第三层需要要怎样处理?无论是机器还是算法很多都是对人对模拟,只是拥有更快的速度而已,所以相信通过人的作用可以弥补这一类需求。

    同样以商品模块举例:除了我已知的商品价格、布局风险外,通过对商品价格分布那张报表的分析,发现在非价格点的价位(比如是10元)销量比正常值都高,正常情况10元价格商品的销量是价格点商品销量的1/5,但是报表显示这一期间的比例高达了1/3,通过进一步分析,发现是由于某一天活动对该商品进行打折促销,从而该商品销量上升,再进一步分析该商品的销量上升并没有给企业带来业绩的上升,该商品的周边商品销量基本没有变化,也就是该商品的连带率是很低的,同时该商品库存并非临保商品。通过调查发现是店长和供应商的私下协议而采取的促销行为。

    以上只是举例,通过人的思考可以发现很多的未知的未知风险。这也就是近些年来bi产品的出现的原因,bi产品希望能够给业务人员一个灵活的数据应用环境,让他们的思考得到延伸和数据上的支持,从而应对未知的未知风险。

    当然,理想情况如此,很多企业并没有将bi产品应用成为以上的价值。原因很多,主要的是包括业务人员没有分析意识、没有一个很好的分析入口(不做进一步解读)。

    综上:

    我将对数据分析的需求分为三层,每一层的使用难度也都有不同,越向后越容易产生“这个报表没什么用”的感觉。现实中,也有很大程度上确实是这个报表没法用,因为很多it人员也并没有理解我做好的报表是为了解决什么样的问题,只知道这个指标有用,我就展示给你看。所以这样的报表可能真的很难用。

    我觉得,让数据发挥它的价值,可以尝试将数据与风险相关联,对风险进行数据化的解读,从而来让报表更加落地,更加可用。

    ps:一切的文章都是我当时的想法,不能作为知识来解读,大家尽做参考,欢迎交流。

  • 相关阅读:
    人生几宝
    sleep() 和 wait() 有什么区别?
    abstract class和interface有什么区别?
    谈谈final, finally, finalize的区别
    字符串转码【String.getBytes()和new String()】
    Redis中文API地址
    java之ibatis数据缓存
    ibatis的缓存机制
    mysql|表row_format的静态与动态,Compact
    Tesseract ocr 3.02学习记录一
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13325868.html
Copyright © 2011-2022 走看看