矩阵乘向量 的 两种几何解释
row picture
以3X3矩阵为例,可理解为:矩阵A的每一行与向量相乘,分别得到一个平面(如:( a_{11}x_1 + a_{12}x_2 + a_{13}x_3 = b_1 )),方程的解是三个平面的交点。
( Amathbf{x}=egin{bmatrix}a_{11} & a_{12} & a_{13}\ a_{21} & a_{22} & a_{23}\ a_{31} & a_{32} & a_{33}end{bmatrix}egin{bmatrix}x_{1}\ x_{2}\ x_{3}end{bmatrix}=egin{bmatrix}a_{11}x_1+a_{12}x_2+a_{13}x_3\ a_{21}x_1+a_{22}x_2+a_{23}x_3\ a_{31}x_1+a_{32}x_2+a_{33}x_3end{bmatrix}= egin{bmatrix}b_1\ b_2\ b_3end{bmatrix}=mathbf{b} )
column picture
这种方法更好理解一些。将矩阵按列拆分,几何上,每一列就是一个向量,方程是矩阵每一列向量的线性组合。当向量之间不独立时(如第三个向量在前两个向量决定的平面上),方程得到的 b 无法填满所有的三维空间(而只能填满那个平面)。
( Amathbf{x}=egin{bmatrix}a_{11} & a_{12} & a_{13}\ a_{21} & a_{22} & a_{23}\ a_{31} & a_{32} & a_{33}end{bmatrix}egin{bmatrix}x_{1}\ x_{2}\ x_{3}end{bmatrix}=x_1egin{bmatrix}a_{11}\ a_{21}\ a_{31}end{bmatrix}+x_2egin{bmatrix}a_{12}\ a_{22}\ a_{32}end{bmatrix}+x_3egin{bmatrix}a_{13}\ a_{23}\ a_{33}end{bmatrix} )
“独立”
按照column picture来理解,将A分为 u, v, w 三个列向量:
如果 u, v, w 相互独立,矩阵A为 可逆矩阵, Ax=0 有唯一解。(看做三个向量组合,若独立,各个分量的解x只能为0)
如果 u, v, w 并不独立,矩阵A为 奇异矩阵, Ax=0 有无数解。(若三个向量组合之后回到原点,则同时放大固定倍数后仍回原点)
为什么叫做“奇异矩阵”(singular matrix):
根据Quora的解释,“奇异”意味着“稀少”、“不寻常”,假如我们随机挑三个列向量u,v,w,那么他们非常可能是相互独立的(因为在一条线上的概率很小),所以不可逆矩阵的情况很稀少、不寻常,因此称之为奇异矩阵。
矩阵乘矩阵 的 四种解释
与矩阵乘向量相类似,分为行与列两种方式。以AxB=C为例:
C的每一行 都是 B的行的加权
将A和B都按照行来切分,C的第一行 看做 A的第一行各个分量*B相对应的行向量 的和,即:
( egin{bmatrix}c_{11}&c_{12}& c_{13}end{bmatrix}=a_{11}*egin{bmatrix}b_{11}&b_{12}& b_{13}end{bmatrix}+a_{12}*egin{bmatrix}b_{21}&b_{22}& b_{23}end{bmatrix}+a_{13}*egin{bmatrix}b_{31}&b_{32}& b_{33}end{bmatrix} )
按照Strang的解释:Each row of A acts on B to give a row of C.
C的每一列 都是 A的列的加权
将A和B都按照列来切分:
( egin{bmatrix}c_{11}\ c_{21}\ c_{31}end{bmatrix}=egin{bmatrix}a_{11}\ a_{21}\a_{31}end{bmatrix}*b_{11}+egin{bmatrix}a_{12}\ a_{22}\a_{32}end{bmatrix}*b_{12}+egin{bmatrix}a_{13}\ a_{23}\a_{33}end{bmatrix}*b_{13} )
A acts on each column of B to give a column of C.
C的每个单元cij 是 A的第i行 乘上 B的第j列
按行理解和按列理解均可,例如按行理解,取的是B的行中某个分量的加权。
分块相乘
将A按照列拆分成块,B按照行拆分成块,C看做A与B的分块乘积之和。
( egin{bmatrix}|& &| \ mathbf{a_1} & ... &mathbf{a_n} \ | & &| end{bmatrix}egin{bmatrix}- & mathbf{b_1} &- \ & ... & \ - & mathbf{b_n} & -end{bmatrix}=egin{bmatrix}\mathbf{a_1b_1+...+a_nb_n}\\end{bmatrix} )