zoukankan      html  css  js  c++  java
  • 怎样比较、分析两组或者两组以上的数据?

    怎样比较、分析两组或者两组以上的数据?

    相信许多人包括数据分析师也 会有这样类似的问题:假如有三组数据,如何分析比较、判定这三组数据,从中能得出什么结论?这个问题比较有代表性,对于两组或者两组以上的数据比较,其实 可以转化为诸多业务问题。例如,两组物流商,分别有两个月的运作时效数据,该如何对比、判断哪家运作物流商运作质量相对较优?再例如,有三个班次的发货组 的发货及时率数据,该如何分析判断哪个组的运作效率相对较高?......

           我个人"数据分析师"给出的方法论是:首先,先要做数据清洁工作,对每一组中的异常数据要检查、分析并剔除,这一点大部分人容易忽略,拿到了数据就直接套 用工具,这是错误的用法。由于异常数据的存在,如果不做数据清洁,得出的结论就不够客观,尤其是物流运作数据,业务的不可控因素较多,因此,数据清洁工作 就显得尤为必要。数据分析师其次是:画图。从图形上直观看数据的分布位置、形状和频率分布,根据各个图形的特定应用范围,可选直方图、点图、趋势图、箱线 图等,这一步千万不能省,因为如果从图形上观察到数据分布的差异很大,那么下一步的定量分析就没有必要了;如果图形上看差异不大,那么就要继续进行定量分 析了。这时,可选方法有均值、中位数、众数和方差,如果均值差不多,关键就看方差了,方差决定了运作的稳定性,稳定性的好坏决定了运作质量的优劣,这也是 六西格玛的理念和测量标准。http://www.cda.cn/view/507.html

           最后,还需要对数据特性做一个检测,是计量型还是计数型,然后可以用minitab统计软件检验下数据是否服从正态分布,目的是看得出的P值大于还是小 于0.05,如果P>0.05,说明数据服从正态分布,这时可以用ANOVA(方差分析)分析比较这几组的数据了,Minitab软件会自动输出对 应的图形分析和相关指标。数据分析师培训

  • 相关阅读:
    Android 弹性布局 FlexboxLayout了解一下
    设计模式——适配器模式
    UML类图中的六种关系(物理设计阶段)
    设计模式——策略模式
    Kaggle-tiantic数据建模与分析
    数据预处理—独热编码
    推荐系统-协同过滤
    推荐系统实战-冷启动问题
    推荐系统-协同过滤原理与实现
    Hadoop生态系统之Yarn
  • 原文地址:https://www.cnblogs.com/amengduo/p/9587713.html
Copyright © 2011-2022 走看看