zoukankan      html  css  js  c++  java
  • 非参数统计

    非参数统计

    统计中的参数是什么?

    大多数统计检验(如一般的线性模型)都假定某种基本分布,如正态分布。

    如果你知道正态分布的平均值和标准偏差,那么你就知道如何计算概率。

    均值和标准差称为参数,所有的理论分布都有参数。

    假设分布和使用参数的统计测试称为参数测试。

    不假定分布或不使用参数的统计测试称为非参数测试。

    ================================================

    为什么我们使用非参数检验?

    虽然自然界中的许多东西都是正态分布的,但有些却不是。例如,在这些情况下,使用t检验可能是不适当的和误导的。

    非参数检验对数据的假设或限制较少。

    非正态分布的例子:

    定性数据:种族、性别、

    有序的分类数据:轻度,中度,重度

    利克特量表:强烈不同意,不同意,没有意见,同意,强烈同意

    ================================================

    非参数测试如何工作?

    大多数非参数检验在假设检验中使登等级而不是原始数据。

    例句:用等级法比较女生和男生的考试成绩。

    零假设:中值平均数

    ================================================

    非参数试验的优势

    适用于任何尺度

    容易计算----最初是在广泛使用计算机之前开发的

    少作假设

    不需要涉及总体参数

    结果可能和参数程序一样精确。

    ==============================================

    非参数试验的缺点

    可能浪费信息

    如果数据允许使用参数过程

    示例:将数据从比率转换为序数比例尺

    P()未广泛提供

    非参数检验综述

    不考虑组的排名数据

    使用组排名的和(或其他函数)来计算测试统计量

    在表中或在计算机中查找p

    拒绝或失败以拒绝零假设

    Sign test:略

    如果没有真正的治疗效果,我们将假设有相同数量的+-体征。

    两组之间是否有显着性差异(-)?我们如何计算p值?

    ===============================================

    威氏符号秩次检验:略

    ==============================================

    符号检验

    不太强大

    -- 不那么敏感

    --更宽的置信区间

    使用更少的信息

    -只显示差异

    威氏符号秩次检验

    ·更强大

    -更敏感

    -置信区间更窄

    使用更多信息

    -也是只显示差异。

    =======================================

    当我们有配对数据,并且不满足配对t检验的假设时,我们有两种方法来完成假设检验。

    Wilcoxon符号等级测试总是比符号测试更好,因为它使用了更多的数据(因为它使用等级)Wilcoxon符号秩检验具有更强的检测差异的能力。

    当正态假设成立时,使用Wilcoxon符号秩检验与t检验相比,没有大的功率损失。当正态假设不成立时,Wilcoxon要强大得多。

    因此,如果正态假设有怀疑,使用Wilcoxon符号秩检验更合适,即Wilcoxon符号秩检验正态与否通吃。

    ===========================================

    Wilcoxon秩和检验

    我们想知道两组的成本是否相同。

    既然我们有两个独立的样本,可以使用两个样本测试。

    请注意,这两个图看起来不正常,并且有许多异常值。

    由于我们有两个独立的样本,而t检验是不合适的,所以我们需要一个非参数检验。

    我们感兴趣的是中位数,而不是平均数。

    利息的假设检验是

    摘要:Wilcoxon秩和检验也称为Mann-Whitney检验。

    检验两个独立的总体概率分布

    对应于2个独立手段的t检验。

    如果n大于10可以用正态拟合

    前提:1.随机抽样2.这两个样品是独立的。3.样本数据至少是顺序的。4.这两个总体仅是位置不同。

    ===========================================

    比较

    H0

    固定信息

    随机信息

    测试统计量

    Sign

    +”的概率与“-”的概率相同

    非零差数

    每一种差异的符号

    +S”数

    理论上的二项分布

    Wilcoxon

    关于零的对称性

    差异绝对值

    每一种差异的符号

    正秩和

    Mann

    来自同一分布的两组

    两组中的等级

    数据点的组成员

    最小群的秩和

    群随机分配

    ============================

    Kruskal-Wallis(H)(用于序数数据)

  • 相关阅读:
    POJ3294Life Forms(广义后缀自动机)(后缀数组+二分+数状数组)
    URAL1517Freedom of Choice(后缀数组)
    POJ2406Power Strings (最小循环节)(KMP||后缀数组)
    POJ2774Long Long Message (后缀数组&后缀自动机)
    SPOJ705 Distinct Substrings (后缀自动机&后缀数组)
    Nacos: Namespace 和 Endpoint 在生产环境下的最佳实践
    阿里PB级Kubernetes日志平台建设实践
    深度解读Helm 3: 犹抱琵琶半遮面
    开发者说:如何参与定义一款 IDE 插件
    从开源小白到 Apache Member,我的成长之路
  • 原文地址:https://www.cnblogs.com/yuanjingnan/p/12025773.html
Copyright © 2011-2022 走看看