zoukankan      html  css  js  c++  java
  • SD与SE的关系,以及异常值


      很多刚进入实验室的同学对实验数据的标准差(SD)与标准误(SE)的含义搞不清,不知道自己的数据报告到底该用SD还是SE。这里对这两个概念进行一些介绍。

      标准差(SD)强调raw data的Variation,而标准误(SE)强调平均数的可信程度。例如在毒理学实验中,可能少数个体出现不良反应也很重要,需要给予关注,因此这时SD比SE更重要。而在一般的生物实验中,如果我们主要关心的不是少数样本的特殊反应(即个别情况),我们主要关心的是整个群体对的平均状况,需要了解整体数据的可信度时,SE比SD更重要。SD强调raw data的Variation,不随n变化,而SE强调的是平均数的可信程度。SE反比于n的平方根。n越大,SE越小,对应的平均数越可信。

      标准误=标准差/√n n是样本量。公式意思是:标准误等于标准差除以样本量的平方根。

      简单的说,SD描述的是sample的离散程度的。SE描述的是精确度,也就是说从sample里你所得到的这个参数(一般是平均值)和真正的population的差别大小。

      也可以参考:https://wenku.baidu.com/view/78403623571252d380eb6294dd88d0d233d43ca2.htmlhttps://wenku.baidu.com/view/08df083531b765ce0408141f.html

      


      异常值outlier:一组测定值中与平均值的偏差超过两倍标准差的测定值 [1] 。与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。在处理数据时,应剔除高度异常的异常值。异常值是否剔除,视具体情况而定。在统计检验时,指定为检出异常值的显著性水平α=0.05,称为检出水平;指定为检出高度异常的异常值的显著性水平α=0.01,称为舍弃水平,又称剔除水平(reject level)。

  • 相关阅读:
    5 粘包现象与解决方案
    4 Socket代码实例
    协程与多路io复用epool关系
    基于selector的socket并发
    基于select类型多路IO复用,实现简单socket并发
    协程实现多并发socket,跟NGINX一样
    利用协程实现简单爬虫
    协程
    进程池pool
    进程锁 Lock
  • 原文地址:https://www.cnblogs.com/triple-y/p/10276333.html
Copyright © 2011-2022 走看看