易混淆的统计概念

zoukankan html css js c++ java

易混淆的统计概念

做回归之我的一般操作step：

scatterplot（）或者直接plot（）观测数据，选择合适的回归模型

检验异常点

检验高杠杆点

检验方差齐性

检验多重共线性（寻找共线性强的解释变量组合）

逐步回归（向前，向后，双向）

全子集回归

假设检验之后得出最优回归方程。再用方程做预测以及数据分类，降维聚类等等操作。对方程以及数据加以更进一步的解释

#####################

一些检验的基本指标参数：

F1-score 就是一个综合考虑precision和recall的metric=2*precision*recall / (precision + recall)

准确率accuracy

查准率precision

查全率recall（recall = sensitivity = true positive rate）

特异性specificity = 1- false positive rate

：unpaired data compared with wilcoxon test which is paired data，与参数分析中的合并 t 检验相对应，只不过后者是从相同方差的正态分布总体中抽样，即方差齐性整体数据正态性分布。

：它与配对样本t检验相对应。计算配对样本之间的差值，然后对差值执行单样本 Wilcoxon 检验

：类似于方差分析，用于检验各个样本（N大于3）的总体是否相同，当normality假设和方差齐性不能满足时（nonparameters test），可用该检验。Kruskal-Wallis方法类似于方差分析中多重比较的S-N-K法，将样本分为几个子集，同一子集内的样本无统计学差异，不同子集内的样本有统计学差异。

多个配对样本的非参数检验（friedman test）
：秩方法实现了对多个总体分布是否存在显著差异的非参数检验方法。也是方差之间的差异大小。

随机区组对应参数检验中的配对数据，wilcoxontest

而完全随机设计就是参数检验中的两独立样本的Mann Whitney U test

T test 是对两个样本均值的差异是否可以推导出两个样本整体的均值差异。

而做T test的premises就是其是否有方差齐性，用F test来judge。简单来说就是实用T检验是有条件的，其中之一就是要符合方差齐次性，这点需要F检验来验证。

调包侠：

library(lme4)

library(nlme)

library(glmer)

都是针对多元多项式混合回归模型开发出来的包

查看全文

相关阅读:
SOA the new OOP?
请教一个程序装入执行的问题!
程序员，如何选择合适的程序语言
 题解 P2387 【[NOI2014]魔法森林】
题解 P4197 【Peaks】
货车运输
 线段树合并
 jvm系列五java内存模型(2)
jvm系列一什么是jvm
jvm系列二内存结构

原文地址：https://www.cnblogs.com/beckygogogo/p/9195416.html

￼易混淆的统计概念

易混淆的统计概念