zoukankan      html  css  js  c++  java
  • 第53件事 数据监控的4种方法

    最近在微信群经常看到公司招聘产品经理,在职位说明中基本上都会要求对运营数据敏感,能够分析数据的异常情况。看来,各个公司对产品经理的数据分析能力要求越来越高了。也是,产品没有运营数据,就好像一个人没有眼睛一样,产品的调优又从何说起呢?
    数据监控主要是对数据的阈值(极限值)进行监控,分析异常原因,并采取相应的措施调优产品。

    1.移动均值监控
    简单移动均值(SMA)的计算公式为Xn+1=(X1+X2+X3+…+Xn)/n。相关数据如表7-11所示。

    2.环比同比监控
    与上一统计段比较,例如2014年7月份与2014年6月份相比较,叫环比。与历史同时期比较,例如2015年7月份与2014年7月份相比,叫同比。
    环比增长率=(本期数-上期数)/上期数×100%;环比增长率反映本期比上期增长了多少。订单量同比、环比监控数据如表7-12所示。

    3.P控制图
    P控制图适用于比率型数据,如整体转化率、新用户比例、活跃用户比例等。我们以电商网站的转化率为例,如图7-16所示。
    图中实线CL指的是中心线,等于均值μ;上面虚线UCL指的是控制上限,等于μ+3σ;下面虚线LCL指的是控制下限,等于μ-3σ。那么到底转化率曲线在什么情况下会被认为是数据异常?主要有如下情况:

    (1).高于控制上限或低于控制下限;
    (2).近期的3个点中的2个点都高于+2σ或都低于-2σ,近期5个点中的4个点都高于+σ或都低于-σ(有出现异常的趋势);
    (3).连续的8个点高于中心线或低于中心线(有偏向性) ;
    (4).连续的6个点呈上升或下降趋势(有明显的偏向趋势) ;
    (5).连续的14个点在中心线上下呈交替状态(周期性, 不稳定) 。

    4.X-MR控制图
    X-MR(单值-移动极差)控制图适用于数值型数据,如客单价、活跃用户数等。我们以电商网站的客单价为例,如图7-17所示。

    图7-17左图中的上面虚线代表X_UCL,下面虚线代表X_LCL,实线代表X_CL,曲线代表客单价;右图中上面虚线代表MR_UCL,下面虚线(跟横坐标几乎重合)代表MR_LCL,实线代表MR_CL,曲线代表客MR。
    其中:
    移动极差MR=|X i-X i-1|;
    X_CL=客单价的总和/1515是样本量;
    X_UCL=客单价的均值+3×MR的均值/d2=客单价的均值+2.66×MR的均值;
    X_LCL=客单价的均值-3×MR的均值/d2=客单价的均值-2.66×MR的均值;
    MR_CL=MR的总和/14;
    14=样本量-1;
    MR_UCL=D4×MR的均值=3.267×MR的均值;
    MR_LCL=D3×MR的均值=0;
    公式中的d2、D3、D4是极差到标准差的转化系数,相当于n=2的极差转化系数,可以看成固定值。那么到底客单价曲线在什么情况下会被认为是数据异常?主要有如下情况:
    (1).高于控制上限或低于控制下限;
    (2).连续7点在中心线一侧;
    (3).连续的7个点上升或下降;
    (4).明显有超出1/3的点落在离控制线很近的区域, 或明显有少于2/3的点落在1/3的区域。

    觉得今天的课有点复杂,消化起来有一定的难度,看来是自己统计学方面的知识和技能欠缺了点儿。要想对数据敏感,基本的数据分析和统计方法还是要掌握并能灵活运用的。


    数据监控最大的目的是利用移动均值、同比环比、P控制、X-MR控制图等方法发现数据的异常情况,作出预警机制,并及时进行原因分析。要求对数据比较敏感,掌握基本的统计学方法并能灵活利用。

  • 相关阅读:
    cf1100 F. Ivan and Burgers
    cf 1033 D. Divisors
    LeetCode 17. 电话号码的字母组合
    LeetCode 491. 递增的子序列
    LeetCode 459.重复的子字符串
    LeetCode 504. 七进制数
    LeetCode 3.无重复字符的最长子串
    LeetCode 16.06. 最小差
    LeetCode 77. 组合
    LeetCode 611. 有效三角形个数
  • 原文地址:https://www.cnblogs.com/SanMaoSpace/p/9416277.html
Copyright © 2011-2022 走看看