线性代数的本质——矩阵乘法与线性变换复合

接上一篇文章《线性代数的本质——矩阵与线性变换》, 当看到矩阵的时候,都可以认为是对空间的一种线性变换的数值化表示。本节的内容是矩阵乘法的本质是什么,矩阵乘法推导过程,并且通过矩阵乘法的本质去理解或者证明两个矩阵相乘不满足交换律,却满足结合律的原因。

矩阵乘法的本质 —— 复合变换

来考虑两个连续的线性变换(先旋转90°,再剪切):

首先是一个旋转90°的线性变换,矩阵描述 $\left[\begin{matrix}0&-1 \ 1 &0 \end{matrix} \right]$,再进行剪切操作,矩阵描述 $\left[ \begin{matrix} 1 & 1 \ 0 & 1 \end{matrix} \right] $

会得到一个新的线性变换,这个新的线性变换被称为前两个线性变换的复合变换。并且这个复合变换和其他线性变换没什么不同,可以直接用矩阵来描述,比如对于上面两个变换得到的复合变换,用矩阵描述就是 $\left[ \begin{matrix} 1 & -1 \ 1 & 0 \end{matrix} \right] $

无论是先经过$\left[\begin{matrix}0&-1 \1 &0\end{matrix} \right]$ -> $\left[ \begin{matrix} 1 & 1 \ 0 & 1 \end{matrix} \right] $ 这样的两步变换,还是只经过一次 $\left[ \begin{matrix} 1 & -1 \ 1 & 0 \end{matrix} \right] $ 这样的变换,最终得到的最终效果是一样的,现在假设有向量$\left[\begin{matrix}x\y\end{matrix} \right]$,先被旋转矩阵变换,然后被剪切矩阵变换,与直接被复合矩阵变换效果等同,因为新的复合矩阵应当捕获到了先旋转再剪切的相同总体效应:

所以两个矩阵相乘的几何意义就是两个线性变换的相继作用

这种复合矩阵的变换称为剪切与旋转的复合变换,这一新的矩阵捕捉到了旋转然后剪切的总体效应,但它是一个单独的作用,而不是两个相继作用的合成。

矩阵相乘的方向,可以看上面矩阵向量乘法的图,向量在右,矩阵在左,意思就类似于函数 $f(x)$,向量是变量,在括号里,矩阵就是函数。如果一个函数的返回值将作为另一个函数的参数 $ g(f(x))$ ,自然需要把$f(x)$ 先算出来,再计算 $g(x)$ ,这很合理,所以矩阵乘法一样,也是从右往左的方式:

矩阵乘法的推导过程

其实下面这两个矩阵相乘,本质就是 $M_2$ 矩阵对 $M_1$ 矩阵的第一个向量(也就是第一列)做矩阵乘法,得到复合矩阵的第一个向量,然后 $M_2$ 矩阵对 $M_1$ 矩阵的第二个向量(也就是第二列)做矩阵乘法,得到复合矩阵的第二个向量,然后就得到了复合矩阵:

根据矩阵乘法的本质得出的推论

根据矩阵乘法的本质,我们知道两个矩阵相乘的几何意义就是两个线性变换的相继作用。

那么矩阵乘法满足交换律吗?也就是 $M_1M_2$ 等同于 $M_2M_1$ 吗?

很显然不满足,如果把矩阵相乘看成是函数叠加,那么非常好理解, $ g(f(x))$ 当然不能等同于 $ f(g(x))$ ,从几何直观来看很显然也不难看出 $M_1M_2$ 和 $M_2M_1$ 会得到两种不同的结果:

那么结合律呢? $(M_1 M_2) M_3$ 等同于 $M_1 (M_2 M_3)$ 吗?

依旧从矩阵乘法的本质出发:首先应用$M_1 M_2$变换,再应用 $M_3$ 变换;与首先应用 $M_2 M_3$ 变换,再应用 $M_1$ 变换,是等效的,完全不需要证明,因为只是将同样的三个变换用同样的顺序依次作用而已,这算得上是对矩阵乘法具有结合性的最好的证明。

三维空间的线性变换

其实上面通过二维空间的得出的结论或者概念可以完美的推广大高维度空间,三维线性变换任然是由基向量的变换结果决定,只不过对于三维空间需要用三个基向量来描述 $\vec{i}$ 、 $\vec{j}$ 、 $\vec{k}$ 。

所以3×3矩阵的乘法本质其实依旧是两个线性变换依次作用: