zoukankan      html  css  js  c++  java
  • 易混淆的统计概念

    做回归之我的一般操作step:

    scatterplot()或者直接plot()观测数据,选择合适的回归模型

    检验异常点

    检验高杠杆点

    检验方差齐性

    检验多重共线性(寻找共线性强的解释变量组合)

    逐步回归(向前,向后,双向)

    全子集回归

    假设检验之后得出最优回归方程。再用方程做预测以及数据分类,降维聚类等等操作。对方程以及数据加以更进一步的解释

    #####################

    一些检验的基本指标参数:

    F1-score 就是一个综合考虑precision和recall的metric=2*precision*recall / (precision + recall)

    准确率accuracy

    查准率precision

    查全率recall(recall = sensitivity = true positive rate)

    特异性specificity = 1- false positive rate

    Pasted Graphic.tiff

    :unpaired data compared with wilcoxon test which is paired data,与参数分析中的合并 t 检验相对应,只不过后者是从相同方差的正态分布总体中抽样,即方差齐性整体数据正态性分布。

    Pasted Graphic 1.tiff

    :它与配对样本t检验相对应。计算配对样本之间的差值,然后对差值执行单样本 Wilcoxon 检验

    Pasted Graphic 2.tiff

    :类似于方差分析,用于检验各个样本(N大于3)的总体是否相同,当normality假设和方差齐性不能满足时(nonparameters test),可用该检验。Kruskal-Wallis方法类似于方差分析中多重比较的S-N-K法,将样本分为几个子集,同一子集内的样本无统计学差异,不同子集内的样本有统计学差异。

    多个配对样本的非参数检验(friedman test)
    :秩方法实现了对多个总体分布是否存在显著差异的非参数检验方法。也是方差之间的差异大小。

    Pasted Graphic 5.tiff

    随机区组对应参数检验中的配对数据,wilcoxontest

    而完全随机设计就是参数检验中的两独立样本的Mann Whitney U test

    T test 是对两个样本均值的差异是否可以推导出两个样本整体的均值差异。

    而做T testpremises就是其是否有方差齐性,用F testjudge。简单来说就是实用T检验是有条件的,其中之一就是要符合方差齐次性,这点需要F检验来验证。

    Pasted Graphic 6.tiff

    调包侠:

    library(lme4)

    library(nlme)

    library(glmer)

    都是针对多元多项式混合回归模型开发出来的包

  • 相关阅读:
    求逆序对的解法
    关于宽搜BFS广度优先搜索的那点事
    大数乘法 poj2389
    二分求幂(快速求幂,二进制求幂)
    2n皇后问题
    poj2406 Power Strings (kmp 求最小循环字串)
    poj1050查找最大子矩阵和
    二叉树的建立和遍历
    已知二叉树前序和中序,求二叉树。
    c/c++连接mysql数据库设置及乱码问题(vs2013连接mysql数据库,使用Mysql API操作数据库)
  • 原文地址:https://www.cnblogs.com/beckygogogo/p/9195416.html
Copyright © 2011-2022 走看看