zoukankan      html  css  js  c++  java
  • excel做数据分析

    小文章经历了两天的修改,发现了原来excel也可以做很基础的数据分析。

    1:散点图做线性回归

     功能很强大,如果是散点图的话,横坐标轴的标签没法改。

    可以调整坐标轴线,刻度,名称,散点样式,回归线绘制,回归方程,误差线,网格线,图例,线型等等参数。

    2:折线图

     折线图的横坐标轴的标签可以修改,系列线还可做“平滑”处理。

     例如,做一个趋势分析,或者做一个频数分布,都是针对一个变量的绘图。比如发生数量。

    做频数分布时,要做一个区间分割。这里要使用到FREQUENCY函数,同时要使用ctrl+shift+enter,变成数组数据。

    3:求相关系数

    有三种办法,一个是PEARSON函数,一个是CORREL函数,一个是数据分析中的“相关系数”选项。

     其中“数据分析”模块默认excel不打开,需要从“文件”-“选项”-“加载项”-”分析库工具“打开。

    4:做T检验

    如果是比较两个样本的均值是否有差异,可以用T检验,适用于样本量小于30的情形,

     直接使用函数TTest即可。

    5:方差分析

    如果有多组的样本(>=2个),比较不同处理的结果是否有显著差异,如果是一种处理就是单因素,多种处理就是多因素方差分析。

    比T检验误差要小,而且简单,不需要一对一对去做T检验。

    例如,使用三种不同肥料,使用4种不同品种的种子,对比产量,看哪种因素对产量有显著影响

    6:卡方检验

    前面有篇日记记录了卡方检验,但比较麻烦的是,需要自己算卡方值,然后再用函数CHIDIST,求出p值。不用自己去差卡方表了。

    计算卡方值很麻烦的话,还是用R语言来算吧,就两句话。

    tablefaw<-matrix(c(2,3468,154,45348),nrow=2,ncol=2)

    chisq.test(tablefaw)

    7:其他例如,时间序列分析,多元回归分析,非参统计暂时没用上。

  • 相关阅读:
    Hadoop 的版本问题
    SSH 端口转发原理
    KM算法
    最大流算法小结
    pku 2195 KM算法求最小权二分匹配
    SAP(最短增广路算法) 最大流模板
    最大流模板
    pku 1459 最大流 SAP
    pku Drainage Ditches 简单最大流 直接套模板 注意可能有重边
    推荐:吴军 谷歌黑板报 《浪潮之颠》
  • 原文地址:https://www.cnblogs.com/marszhw/p/12290281.html
Copyright © 2011-2022 走看看