Untitled

标准正交矩阵¶

定义标准正交向量（orthonormal）： $q_i^Tq_j=\begin{cases}0\quad i\neq j\1\quad i=j\end{cases}$ ，我们将标准正交向量放入矩阵中，有 $Q=\Bigg[q_1 q_2 \cdots q_n\Bigg]$ 。

根据标准正交向量的定义，计算 $Q^TQ=\begin{bmatrix} & q_1^T & \ & q_2^T & \ & \vdots & \ & q_n^T & \end{bmatrix}\Bigg[q_1 q_2 \cdots q_n\Bigg]=\begin{bmatrix}1&0&\cdots&0\0&1&\cdots&0\\vdots&\vdots&\ddots&\vdots\0&0&\cdots&1\end{bmatrix}=I$ ，我们也把 $Q$ 称为标准正交矩阵（orthonormal matrix）。

特别的，当 $Q$ 恰好是方阵时，由于正交性，易得 $Q$ 是可逆的，又 $Q^TQ=I$ ，所以 $Q^T=Q^{-1}$ 。

举个置换矩阵的例子： $Q=\begin{bmatrix}0&1&0\1&0&0\0&0&1\end{bmatrix}$ ，则 $Q^T=\begin{bmatrix}0&1&0\0&0&1\1&0&0\end{bmatrix}$ ，易得 $Q^TQ=I$ 。
使用上一讲的例子 $Q=\begin{bmatrix}\cos\theta&-\sin\theta\\sin\theta&\cos\theta\end{bmatrix}$ ，列向量长度为 $1$ ，且列向量相互正交。
其他例子 $Q=\frac{1}{\sqrt 2}\begin{bmatrix}1&1\1&-1\end{bmatrix}$ ，列向量长度为 $1$ ，且列向量相互正交。
使用上一个例子的矩阵，令 $Q'=c\begin{bmatrix}Q&Q\Q&-Q\end{bmatrix}$ ，取合适的 $c$ 令列向量长度为 $1$ 也可以构造标准正交矩阵： $Q=\frac{1}{2}\begin{bmatrix}1&1&1&1\1&-1&1&-1\1&1&-1&-1\1&-1&-1&1\end{bmatrix}$ ，这种构造方法以阿德玛（Adhemar）命名，对 $2, 4, 16, 64, \cdots$ 阶矩阵有效。
再来看一个例子， $Q=\frac{1}{3}\begin{bmatrix}1&-2&2\2&-1&-2\2&2&1\end{bmatrix}$ ，列向量长度为 $1$ ，且列向量相互正交。格拉姆-施密特正交化法的缺点在于，由于要求得单位向量，所以我们总是除以向量的长度，这导致标准正交矩阵中总是带有根号，而上面几个例子很少有根号。

再来看标准正交化有什么好处，假设要做投影，将向量 $b$ 投影在标准正交矩阵 $Q$ 的列空间中，根据上一讲的公式得 $P=Q(Q^TQ)^{-1}Q^T$ ，易得 $P=QQ^T$ 。我们断言，当列向量为标准正交基时， $QQ^T$ 是投影矩阵。极端情况，假设矩阵是方阵，而其列向量是标准正交的，则其列空间就是整个向量空间，而投影整个空间的投影矩阵就是单位矩阵，此时 $QQ^T=I$ 。可以验证一下投影矩阵的两个性质： $(QQ^T)^T=(Q^T)^TQ^T=QQ^T$ ，得证； $(QQ^T)^2=QQ^TQQ^T=Q(Q^TQ)Q^T=QQ^T$ ，得证。

我们计算的 $A^TA\hat x=A^Tb$ ，现在变为 $Q^TQ\hat x=Q^Tb$ ，也就是 $\hat x=Q^Tb$ ，分解开来看就是 $\underline{\hat x_i=q_i^Tb}$ ，这个式子在很多数学领域都有重要作用。当我们知道标准正交基，则解向量第 $i$ 个分量为基的第 $i$ 个分量乘以 $b$ ，在第 $i$ 个基方向上的投影就等于 $q_i^Tb$ 。

Gram-Schmidt正交化法¶

我们有两个线性无关的向量 $a, b$ ，先把它们化为正交向量 $A, B$ ，再将它们单位化，变为单位正交向量 $q_1=\frac{A}{\left|A\right|}, q_2=\frac{B}{\left|B\right|}$ ：

我们取定 $a$ 向量的方向， $a=A$ ；
接下来将 $b$ 投影在 $A$ 的法方向上得到 $B$ ，也就是求子空间投影一讲中，我们提到的误差向量 $e=b-p$ ，即 $B=b-\frac{A^Tb}{A^TA}A$ 。检验一下 $A\bot B$ ， $A^TB=A^Tb-A^T\frac{A^Tb}{A^TA}A=A^Tb-\frac{A^TA}{A^TA}A^Tb=0$ 。（ $\frac{A^Tb}{A^TA}A$ 就是 $A\hat x=p$ 。）

如果我们有三个线性无关的向量 $a, b, c$ ，则我们现需要求它们的正交向量 $A, B, C$ ，再将它们单位化，变为单位正交向量 $q_1=\frac{A}{\left|A\right|}, q_2=\frac{B}{\left|B\right|}, q_3=\frac{C}{\left|C\right|}$ ：

前两个向量我们已经得到了，我们现在需要求第三个向量同时正交于 $A, B$ ；
我们依然沿用上面的方法，从 $c$ 中减去其在 $A, B$ 上的分量，得到正交与 $A, B$ 的 $C$ ： $C=c-\frac{A^Tc}{A^TA}A-\frac{B^Tc}{B^TB}B$ 。

现在我们试验一下推导出来的公式， $a=\begin{bmatrix}1\1\1\end{bmatrix}, b=\begin{bmatrix}1\0\2\end{bmatrix}$ ：

则 $A=a=\begin{bmatrix}1\1\1\end{bmatrix}$ ；
根据公式有 $B=a-hA$ ， $h$ 是比值 $\frac{A^Tb}{A^TA}=\frac{3}{3}$ ，则 $B=\begin{bmatrix}1\1\1\end{bmatrix}-\frac{3}{3}\begin{bmatrix}1\0\2\end{bmatrix}=\begin{bmatrix}0\-1\1\end{bmatrix}$ 。验证一下正交性有 $A\cdot B=0$ 。
单位化， $q_1=\frac{1}{\sqrt 3}\begin{bmatrix}1\1\1\end{bmatrix},\quad q_2=\frac{1}{\sqrt 2}\begin{bmatrix}1\0\2\end{bmatrix}$ ，则标准正交矩阵为 $Q=\begin{bmatrix}\frac{1}{\sqrt 3}&0\\frac{1}{\sqrt 3}&-\frac{1}{\sqrt 2}\\frac{1}{\sqrt 3}&\frac{1}{\sqrt 2}\end{bmatrix}$ ，对比原来的矩阵 $D=\begin{bmatrix}1&1\1&0\1&2\end{bmatrix}$ ，有 $D, Q$ 的列空间是相同的，我们只是将原来的基标准正交化了。

我们曾经用矩阵的眼光审视消元法，有 $A=LU$ 。同样的，我们也用矩阵表达标准正交化， $A=QR$ 。设矩阵 $A$ 有两个列向量 $\Bigg[a_1 a_2\Bigg]$ ，则标准正交化后有 $\Bigg[a_1 a_2\Bigg]=\Bigg[q_1 q_2\Bigg]\begin{bmatrix}a_1^Tq_1&a_2^Tq_1\a_1^Tq_2&a_2^Tq_2\end{bmatrix}$ ，而左下角的 $a_1^Tq_2$ 始终为 $0$ ，因为Gram-Schmidt正交化总是使得 $a_1\bot q_2$ ，后来构造的向量总是正交于先前的向量。所以这个 $R$ 矩阵是一个上三角矩阵。

标准正交矩阵¶

Gram-Schmidt正交化法¶

评论