协方差一般用来研究诸多实验中各个变量之间的关系。举个例子来说,有n个实验,每个实验得到两个数据,分别为变量x1和变量x2。设n = 7。这七组实验得到的数据分别为: (3,5), (4,5.5),(2,4),(6,7),(8,10),(2,5),(5,7.5)
用MATLAB中的scatter函数作图,即可得到下图:
可以看到,很明显的,变量x2与变量x1是有关系的:变量x2随变量x1的增大而增大。那么,它的协方差一定大于0。
其结果为
设这个矩阵为C,则C(1,1)为变量x1的方差,C(2,2)为变量x2的方差。C(1,2)=C(2,1)为变量x1与变量x2之间的协方差。
若协方差大于0,则变量x2随变量x1的增大而增大;若协方差小于0,则变量x2随变量x1的增大而减小;若协方差接近0,则变量x2与x1没有关系;
其实,在判断两个变量之间的相关程度时,协方差并不是一个最好的度量方式。相关系数比协方差更能说明问题。相关系数将协方差归一化,归一化后的结果在[-1,1]之间。若变量x2随变量x1的增大严格线性增大,则相关系数为1; 若变量x2随变量x1的增大严格线性减小,则相关系数为-1;若变量x2不随x1的变化而变化,则相关系数为0;
在上一个例子中,其相关系数为