返回博客列表

第一讲:方程组的几何解释

第一讲:方程组的几何解释

我们从求解线性方程组来开始这门课,从一个普通的例子讲起:方程组有2个未知数,一共有2个方程,分别来看方程组的“行图像”和“列图像”。

有方程组\begin{cases}2x&-y&=0\-x&+2y&=3\end{cases},写作矩阵形式有\begin{bmatrix}2&-1\-1&2\end{bmatrix}\begin{bmatrix}x\y\end{bmatrix}=\begin{bmatrix}0\3\end{bmatrix},通常我们把第一个矩阵称为系数矩阵A,将第二个矩阵称为向量x,将第三个矩阵称为向量b,于是线性方程组可以表示为Ax=b

我们来看行图像,即直角坐标系中的图像:

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

x = [-2, 2, -2, 2]
y = [-4, 4, 0.5, 2.5]

fig = plt.figure()
plt.axhline(y=0, c='black')
plt.axvline(x=0, c='black')

plt.plot(x[:2], y[:2], x[2:], y[2:])

plt.draw()

png

plt.close(fig)

上图是我们都很熟悉的直角坐标系中两直线相交的情况,接下来我们按列观察方程组x\begin{bmatrix}2\-1\end{bmatrix}+y\begin{bmatrix}-1\2\end{bmatrix}=\begin{bmatrix}0\3\end{bmatrix}(我们把第一个向量称作col_1,第二个向量称作col_2,以表示第一列向量和第二列向量),要使得式子成立,需要第一个向量加上两倍的第二个向量,即1\begin{bmatrix}2\-1\end{bmatrix}+2\begin{bmatrix}-1\2\end{bmatrix}=\begin{bmatrix}0\3\end{bmatrix}

现在来看列图像,在二维平面上画出上面的列向量:

from functools import partial

fig = plt.figure()
plt.axhline(y=0, c='black')
plt.axvline(x=0, c='black')
ax = plt.gca()
ax.set_xlim(-2.5, 2.5)
ax.set_ylim(-3, 4)

arrow_vector = partial(plt.arrow, width=0.01, head_width=0.1, head_length=0.2, length_includes_head=True)

arrow_vector(0, 0, 2, -1, color='g')
arrow_vector(0, 0, -1, 2, color='c')
arrow_vector(2, -1, -2, 4, color='b')
arrow_vector(0, 0, 0, 3, width=0.05, color='r')

plt.draw()

png

plt.close(fig)

如图,绿向量col_1与蓝向量(两倍的蓝绿向量col_2)合成红向量b

接着,我们继续观察x\begin{bmatrix}2\-1\end{bmatrix}+y\begin{bmatrix}-1\2\end{bmatrix}=\begin{bmatrix}0\3\end{bmatrix}col_1,col_2的某种线性组合得到了向量b,那么col_1,col_2的所有线性组合能够得到什么结果?它们将铺满整个平面。

下面进入三个未知数的方程组:\begin{cases}2x&-y&&=0\-x&+2y&-z&=-1\&-3y&+4z&=4\end{cases},写作矩阵形式A=\begin{bmatrix}2&-1&0\-1&2&-1\0&-3&4\end{bmatrix},\ b=\begin{bmatrix}0\-1\4\end{bmatrix}

在三维直角坐标系中,每一个方程将确定一个平面,而例子中的三个平面会相交于一点,这个点就是方程组的解。

同样的,将方程组写成列向量的线性组合,观察列图像:x\begin{bmatrix}2\-1\0\end{bmatrix}+y\begin{bmatrix}-1\2\-3\end{bmatrix}+z\begin{bmatrix}0\-1\4\end{bmatrix}=\begin{bmatrix}0\-1\4\end{bmatrix}。易知教授特意安排的例子中最后一个列向量恰巧等于等式右边的b向量,所以我们需要的线性组合为x=0,y=0,z=1。假设我们令b=\begin{bmatrix}1\1\-3\end{bmatrix},则需要的线性组合为x=1,y=1,z=0

我们并不能总是这么轻易的求出正确的线性组合,所以下一讲将介绍消元法——一种线性方程组的系统性解法。

现在,我们需要考虑,对于任意的b,是否都能求解Ax=b?用列向量线性组合的观点阐述就是,列向量的线性组合能否覆盖整个三维向量空间?对上面这个例子,答案是肯定的,这个例子中的A是我们喜欢的矩阵类型,但是对另一些矩阵,答案是否定的。那么在什么情况下,三个向量的线性组合得不到b

——如果三个向量在同一个平面上,问题就出现了——那么他们的线性组合也一定都在这个平面上。举个例子,比如col_3=col_1+col_2,那么不管怎么组合,这三个向量的结果都逃不出这个平面,因此当b在平面内,方程组有解,而当b不在平面内,这三个列向量就无法构造出b。在后面的课程中,我们会了解到这种情形称为奇异矩阵不可逆

下面我们推广到九维空间,每个方程有九个未知数,共九个方程,此时已经无法从坐标图像中描述问题了,但是我们依然可以从求九维列向量线性组合的角度解决问题,仍然是上面的问题,是否总能得到b?当然这仍取决于这九个向量,如果我们取一些并不相互独立的向量,则答案是否定的,比如取了九列但其实只相当于八列,有一列毫无贡献(这一列是前面列的某种线性组合),则会有一部分b无法求得。

接下来介绍方程的矩阵形式Ax=b,这是一种乘法运算,举个例子,取A=\begin{bmatrix}2&5\1&3\end{bmatrix},\ x=\begin{bmatrix}1\2\end{bmatrix},来看如何计算矩阵乘以向量:

  • 我们依然使用列向量线性组合的方式,一次计算一列,\begin{bmatrix}2&5\1&3\end{bmatrix}\begin{bmatrix}1\2\end{bmatrix}=1\begin{bmatrix}2\1\end{bmatrix}+2\begin{bmatrix}5\3\end{bmatrix}=\begin{bmatrix}12\7\end{bmatrix}
  • 另一种方法,使用向量内积,矩阵第一行向量点乘x向量\begin{bmatrix}2&5\end{bmatrix}\cdot\begin{bmatrix}1&2\end{bmatrix}^T=12,\ \begin{bmatrix}1&3\end{bmatrix}\cdot\begin{bmatrix}1&2\end{bmatrix}^T=7

教授建议使用第一种方法,将Ax看做A列向量的线性组合。

评论