理解协方差矩阵 - 走看看

zoukankan html css js c++ java

理解协方差矩阵

1. 方差和协方差的定义

在统计学中，方差是用来度量单个随机变量的离散程度，而协方差则一般用来刻画两个随机变量的相似程度，其中，方差的计算公式为
$sigma_x^2=frac{1}{n-1}sum_{i=1}^nleft(x_i-ar{x} ight)^2$
其中， $n$ 表示样本量，符号 $ar{x}$ 表示观测样本的均值。

协方差的计算公式被定义为：

在公式中，符号 $ar{x},ar{y}$ 分别表示两个随机变量所对应的观测样本均值，据此，我们发现：方差 $sigma_x^2$ 可视作随机变量 $x$ 关于其自身的协方差 $sigmaleft(x,x ight)$ .

2. 从方差/协方差到协方差矩阵

根据方差的定义，给定 $d$ 个随机变量 $x_k,k=1,2,...,d$ ，则这些随机变量的方差为

$sigma({x_k},{x_k})=frac{1}{n-1}sum_{i=1}^nleft(x_{ki}-ar{x}_k ight)^2,k=1,2,...,d$

其中， $x_{ki}$ 表示随机变量 $x_k$ 中的第 $i$ 个观测样本， $n$ 表示样本量，每个随机变量所对应的观测样本数量均为 $n$ 。

其中，为方便书写， $x_{ki}$ 表示随机变量 $x_k$ 中的第 $i$ 个观测样本， $n$ 表示样本量，每个随机变量所对应的观测样本数量均为 $n$ 。

因此，协方差矩阵为

$Sigma=left[ egin{array}{ccc}sigma({x_1},{x_1}) & cdots & sigmaleft(x_1,x_d ight) \ vdots & ddots & vdots \ sigmaleft(x_d,x_1 ight) & cdots & sigma({x_d},{x_d}) \ end{array} ight]inmathbb{R}^{d imes d}$

其中，对角线上的元素为各个随机变量的方差，非对角线上的元素为两两随机变量之间的协方差，根据协方差的定义，我们可以认定：矩阵 $Sigma$ 为对称矩阵(symmetric matrix)，其大小为 $d imes d$ 。

为了便于理解，我们先从两个变量的协方差矩阵来理解：

2.1 两个变量的协方差矩阵

假设我们有 4 个样本，每个样本都有两个变量，也就是两个特征，它们表示如下： $x_1=(1,2)$ ， $x_2=(3,6)$ ， $x_3=(4,2)$ ， $x_4=(5,2)$

用一个矩阵表示为：

现在，我们用两个变量空间 $X$ ， $Y$ 来表示这两个特征：

由于协方差反应的是两个变量之间的相关性，因此，协方差矩阵表示的是所有变量之间两两相关的关系，具体来讲，一个包含两个特征的矩阵，其协方差矩阵应该有 $2 imes 2$ 大小：

接下来，就来逐一计算 $Cov(Z)$ 的值。首先，我们需要先计算出 $X$ ， $Y$ 两个特征空间的平均值： $overline x=3.25$ ， $overline y=3$ 。然后，根据协方差的数学定义，计算协方差矩阵的每个元素：

所以协方差矩阵：

$Cov(Z)=egin{bmatrix} 2.9167 & -0.3333 \ -0.3333 & 4.000 end{bmatrix}$

我们已经可以从中总结出协方差矩阵 $Sigma$ 的「计算公式」：

2.2 多个变量的协方差矩阵

接下来，就用上面推出的计算协方差矩阵的「计算公式」。假设我们有三个样本： $x_1=(1,2,3,4)^T$ ， $x_2=(3,4,1,2)^T$ ， $x_3=(2,3,1,4)^T$ 。同理我们将它们表示成样本矩阵：

$Z=egin{bmatrix} 1 & 2 & 3 & 4 \ 3 & 4 & 1 & 2 \ 2 & 3 & 1 & 4 end{bmatrix}$

按照上面给出的计算套路，我们需要先计算出矩阵每一列的均值，从左到右分别为：2、3、1.67、3.33。然后按照上面讲到的公式，计算矩阵每个元素的值，对了，四个变量的协方差矩阵，大小为 $4 imes 4$ ：

$Sigma_{11}=frac{(第1列-第1列的均值)^T(第1列-第1列的均值)}{样本数-1}=frac{(-1,1,0)^T(-1,1,0)}{2}=1$

....

3. 理解协方差矩阵

这是一个三维的例子，跟上面的例子差不多，只不过换了一种表达方式：

查看全文

相关阅读:
[转载]Nginx 常见应用技术指南
 【转载】Memcached Tip 2：Session同步
 【转载】大规模网站架构实战之体系结构
 【转载】3种Nginx防盗链的方法
 poj2390
poj2395
poj2393
poj2209
poj2392
爱我更多，好吗？

原文地址：https://www.cnblogs.com/jiashun/p/Covariance.html

Copyright © 2011-2022 走看看