在概率论和统计学中,相关(Correlation,或称相关系数或关联系数)显示两个随机变量之间线性关系的强度和方向。在统计学中,相关的意义是用来衡量两个变量相对于其相互独立的距离。在这个广义的定义下,有许多根据数据特点而定义的用来衡量数据相关的系数。
对于不同测量尺度的变量,有不同的相关系数可用:
- Pearson相关系数(Pearson's r):衡量两个等距尺度或等比尺度变量之相关性。是最常见的,也是学习统计学时第一个接触的相关系数
- Spearman等级相关系数:衡量两个次序尺度变量之相关性。
- Kendall等级相关系数(英语:Kendall tau rank correlation coefficient):衡量两个人为次序尺度变量(原始资料为等距尺度)之相关性。
- Kendall和谐系数:衡量两个次序尺度变量之相关性。
- Gamma相关系数:衡量两个次序尺度变量之相关性。
- Phi相关系数(英语:Phi coefficient):衡量两个真正名目尺度的二分变量之相关性。
- 列联相关系数(contingency coefficient):衡量两个真正名目尺度变量之相关性。
- 净相关(partial correlation):在模型中有多个自变量(或解释变量)时,去除掉其他自变量的影响,只衡量特定一个自变量与因变量之间的相关性。自变量和因变量皆为连续变量。
- 相关比(correlation ratio):衡量两个连续变量之相关性。
- 四分相关(tetrachoric correlation):衡量两个人为名目尺度(原始资料为等距尺度)的二分变量之相关性。
- Kappa一致性系数(K coefficient of agreement):衡量两个名目尺度变量之相关性。
- 点二系列相关系数(point-biserial correlation):X变量是真正名目尺度二分变量。Y变量是连续变量。
二系列相关系数(biserial correlation):X变量是人为名目尺度二分变量。Y变量是连续变量。