线性代数的本质——矩阵与线性变换

变换类似于函数,输入参数值,输出结果。为什么习惯性称作为变换而不是函数呢?变换从某种意义来说是从几何直观呈现出变化。比如接收一个向量输入,得到一个向量输出。在几何空间中的可视化表达就是原向量转动、缩放得到输出向量。而线性变换就是这个转动与缩放的过程,此过程可以通过一个矩阵来进行数值化的精确表达。

什么是线性变换

像如下变换就不是线性变换:

线性变换的两条规则:

1、直线变换后仍然为直线,不能弯曲;

2、原点位置固定不变;

简单来说可以将线性变换看作一种 “保持网格线平行且等距分布” 的变换。

线性变换实际可以看成空间的基的变换。而其他所有向量都能用这组基线性表示,且变换前后线性表示的系数不变。所以 只需要知道空间基向量变换后的坐标就能知道所有向量在这个变换后的情况。

变换前,向量 v 是 $\vec{i}$ 和 $\vec{j}$ 的一个特定线性组合,变换后的向量v同样也是变换后的 $\vec{i}$ 和 $\vec{j}$ 的同样的线性组合。

所以只需要根据变换后的 $\vec{i}$ 和 $\vec{j}$ ,就能推断出变换后的v。

确切的说,只需要根据变换后的 $\vec{i}$ 和 $\vec{j}$ ,就能推断出任意向量在变换之后的位置,完全不用考虑变换的过程是什么样的。

如果一个向量是 $\left[ \begin{matrix} x\y\end{matrix} \right]$ ,那么变换后的向量就是x乘以变换后的 $\vec{i}$ 加上y乘以变换后的 $\vec{j}$:

用数值描述线性变换 —— 矩阵

所以一个二维线性变换仅由4个数字完全确定,那就是变换后的 $\vec{i}$ 和 $\vec{j}$ 。通常我们将变换后的 $\vec{i}$ 和 $\vec{j}$ 的坐标封装在2×2的格子里面,称之为2×2矩阵。

那么任意向量与这个矩阵的乘法(二维空间内)就是这个向量在这个矩阵描述的线性变换后的向量坐标。

比如把一个向量逆时针旋转90°,那么需要矩阵就是 $\left[ \begin{matrix} 0 & -1\1 & 0 \end{matrix} \right] $

如果变换后的 $\vec{i}$ 和 $\vec{j}$ 线性相关

也就意味着这个线性变换会把原本的二维张成的空间给压缩成一维空间。

线性变换是操纵空间的一种手段,这种变换只需要几个数字就能描述清楚,这些数字就是变换后基向量的坐标,每当看到一个矩阵的时候,都可以将其解读为对空间的一种特定变换。而矩阵向量乘法就是计算线性变换作用于给定向量的一种途径。