自变量和因变量
自变量 (independent variable):由研究者主动操纵,而引起的因变量发生变化的因素或条件
因变量 (dependent variable):会随着另一个(或者另几个)因素(或条件)的变化而变化的值
假设检验的概念
什么是假设检验(hypothesis test)?
用来验证一个实验样本和已知的总体样本之间差别的检验方法。
假设检验涉及到的概念:
1.α level。常用的 α level 包括:0.05(5%);0.01(1%);0.001(0.1%)。作用是协助划定分布的临界区域。
2.零假设 (null hypothesis)。H0
- 对于相依样本或者重复测量,零假设一般指前后不会发生变化:
- 对应独立样本,零假设一般指两个样本间无差别或者差别不会变化:
3.对立假设(alternative hypothesis)。 Ha,简单理解就是零假设取反。
统计测试的类型
- 统计测试类型主要包括:
- Z 检验
- t 检验
- 单样本 t 检验 dependent t test
- 双样本 t 检验 independent t test
- 配对 t 检验 paired t test
- 对于已知总体均值和标准偏差时,使用 Z 检验
- 只已知样本时,使用 t 检验
- 当总体标准差未知时,使用单样本 t 检验 估计总体均值,并将其与目标值或参考值进行比较。
- 需要分析两个独立组的均值是否存在差异或者计算两个总体均值差异范围时,使用双样本 t 检验
- 确定两个配对样本之差的均值不等于 0(或目标值)或者计算可能包含差异总体均值的值的范围。
- 根据假设,还可以分为:
- 单尾正向检验
- 单尾负向检验
- 双尾检验(对于双尾检验,需要将 α level 表示的概率 除2)
集中趋势测量
包括三种度量:
- 均值 - mean 数值的平均值公式如下:
- 中位数 - median:处于数据集正中间的数值。如果有俩个,那么去这两个数值的平均数。如下:
- 单数的数据集:中位数处于 n/2 的位置
- 偶数的数据集:中位数为
- 众数 - mode 出现频率最高的数字
变异测量
包括以下几种度量方式:
- 范围:最大值和最小值之间的差。 Xmax - Xmin
- IQR (Interquartile range):将数据集进行四等分后,IQR = Q3 - Q1
- 样本标准偏差:
- 两组样本值的差异:
- 两组样本值的差异均值:
- 差异的样本标准偏差:
- 均值标准误差:
- t统计量:
- Cohen's d:
- 相关系数 ,