二维列联表
二维列联表又称 (r imes s) 列联表。
我们从两种角度观察一组数据。第一种将被观察对象分为(r)类,比如,被调查群体吸烟和不吸烟的人数。第二种将被观察对象分为(s)类,比如,被调查群体中患肺癌和未患肺癌的人数。此时二维列联表是一个矩阵(X in mathbb{N}^{r imes s}),其中(x_{ij})表示同时属于第一种角度的第(i)类,和第二种角度的第(j)类的个数。比如,吸烟并患肺癌的人数。
卡方检验
Pearson 卡方检验,判断各变量之间的独立性。TBC
MATLAB中的函数crosstab
输入变量(a in \{ 1, dots, r \}^N, b in \{1, dots, s \}^N),其中(N)是被观察对象的个数。
[
[
m{table, chi2, p, labels} ] =
m{crosstab}(a, b)
]
其中(
m{table})就是二联表(X),其中(x_{ij} = sum_{p,q} (a_p == i)*(b_q == j))。(
m{chi2})是卡方检验。
labels是每一类的名称,按照我们上述的描述,第一种角度的第一类叫1,第二类叫2,等等。但也可能第一种角度第一类就叫2,也是可以的