线性代数¶
行列式¶
1.行列式按行(列)展开定理
(1) 设A = ( a_{{ij}} ){n \times n},则:a{i1}A_{j1} +a_{i2}A_{j2} + \cdots + a_{{in}}A_{{jn}} = \begin{cases}|A|,i=j\ 0,i \neq j\end{cases}
或a_{1i}A_{1j} + a_{2i}A_{2j} + \cdots + a_{{ni}}A_{{nj}} = \begin{cases}|A|,i=j\ 0,i \neq j\end{cases}即 AA^{} = A^{}A = \left| A \right|E,其中:A^{*} = \begin{pmatrix} A_{11} & A_{12} & \ldots & A_{1n} \ A_{21} & A_{22} & \ldots & A_{2n} \ \ldots & \ldots & \ldots & \ldots \ A_{n1} & A_{n2} & \ldots & A_{{nn}} \ \end{pmatrix} = (A_{{ji}}) = {(A_{{ij}})}^{T}
D_{n} = \begin{vmatrix} 1 & 1 & \ldots & 1 \ x_{1} & x_{2} & \ldots & x_{n} \ \ldots & \ldots & \ldots & \ldots \ x_{1}^{n - 1} & x_{2}^{n - 1} & \ldots & x_{n}^{n - 1} \ \end{vmatrix} = \prod_{1 \leq j < i \leq n}^{}\,(x_{i} - x_{j})
(2) 设A,B为n阶方阵,则\left| {AB} \right| = \left| A \right|\left| B \right| = \left| B \right|\left| A \right| = \left| {BA} \right|,但\left| A \pm B \right| = \left| A \right| \pm \left| B \right|不一定成立。
(3) \left| {kA} \right| = k^{n}\left| A \right|,A为n阶方阵。
(4) 设A为n阶方阵,|A^{T}| = |A|;|A^{- 1}| = |A|^{- 1}(若A可逆),|A^{*}| = |A|^{n - 1}
n \geq 2
(5) \left| \begin{matrix} & {A\quad O} \ & {O\quad B} \ \end{matrix} \right| = \left| \begin{matrix} & {A\quad C} \ & {O\quad B} \ \end{matrix} \right| = \left| \begin{matrix} & {A\quad O} \ & {C\quad B} \ \end{matrix} \right| =| A||B|
,A,B为方阵,但\left| \begin{matrix} {O} & A_{m \times m} \ B_{n \times n} & { O} \ \end{matrix} \right| = ({- 1)}^{{mn}}|A||B| 。
(6) 范德蒙行列式D_{n} = \begin{vmatrix} 1 & 1 & \ldots & 1 \ x_{1} & x_{2} & \ldots & x_{n} \ \ldots & \ldots & \ldots & \ldots \ x_{1}^{n - 1} & x_{2}^{n 1} & \ldots & x_{n}^{n - 1} \ \end{vmatrix} = \prod_{1 \leq j < i \leq n}^{}\,(x_{i} - x_{j})
设A是n阶方阵,\lambda_{i}(i = 1,2\cdots,n)是A的n个特征值,则
|A| = \prod_{i = 1}^{n}\lambda_{i}
矩阵¶
矩阵:m \times n个数a_{{ij}}排成m行n列的表格\begin{bmatrix} a_{11}\quad a_{12}\quad\cdots\quad a_{1n} \ a_{21}\quad a_{22}\quad\cdots\quad a_{2n} \ \quad\cdots\cdots\cdots\cdots\cdots \ a_{m1}\quad a_{m2}\quad\cdots\quad a_{{mn}} \ \end{bmatrix} 称为矩阵,简记为A,或者\left( a_{{ij}} \right)_{m \times n} 。若m = n,则称A是n阶矩阵或n阶方阵。
矩阵的线性运算
1.矩阵的加法
设A = (a_{{ij}}),B = (b_{{ij}})是两个m \times n矩阵,则m \times n 矩阵C = c_{{ij}}) = a_{{ij}} + b_{{ij}}称为矩阵A与B的和,记为A + B = C 。
2.矩阵的数乘
设A = (a_{{ij}})是m \times n矩阵,k是一个常数,则m \times n矩阵(ka_{{ij}})称为数k与矩阵A的数乘,记为{kA}。
3.矩阵的乘法
设A = (a_{{ij}})是m \times n矩阵,B = (b_{{ij}})是n \times s矩阵,那么m \times s矩阵C = (c_{{ij}}),其中c_{{ij}} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{{in}}b_{{nj}} = \sum_{k =1}^{n}{a_{{ik}}b_{{kj}}}称为{AB}的乘积,记为C = AB 。
4. \mathbf{A}^{\mathbf{T}}、\mathbf{A}^{\mathbf{-1}}、\mathbf{A}^{\mathbf{}}三者之间的关系*
(1) {(A^{T})}^{T} = A,{(AB)}^{T} = B^{T}A^{T},{(kA)}^{T} = kA^{T},{(A \pm B)}^{T} = A^{T} \pm B^{T}
(2) \left( A^{- 1} \right)^{- 1} = A,\left( {AB} \right)^{- 1} = B^{- 1}A^{- 1},\left( {kA} \right)^{- 1} = \frac{1}{k}A^{- 1},
但 {(A \pm B)}^{- 1} = A^{- 1} \pm B^{- 1}不一定成立。
(3) \left( A^{} \right)^{} = |A|^{n - 2}\ A\ \ (n \geq 3),\left({AB} \right)^{} = B^{}A^{}, \left( {kA} \right)^{} = k^{n -1}A^{*}{\ \ }\left( n \geq 2 \right)
但\left( A \pm B \right)^{} = A^{} \pm B^{*}不一定成立。
(4) {(A^{- 1})}^{T} = {(A^{T})}^{- 1},\ \left( A^{- 1} \right)^{} ={(AA^{})}^{- 1},{(A^{})}^{T} = \left( A^{T} \right)^{}
5.有关\mathbf{A}^{\mathbf{}}的结论*
(1) AA^{} = A^{}A = |A|E
(2) |A^{}| = |A|^{n - 1}\ (n \geq 2),\ \ \ \ {(kA)}^{} = k^{n -1}A^{},{{\ \ }\left( A^{} \right)}^{*} = |A|^{n - 2}A(n \geq 3)
(3) 若A可逆,则A^{} = |A|A^{- 1},{(A^{})}^{*} = \frac{1}{|A|}A
(4) 若A为n阶方阵,则:
r(A^*)=\begin{cases}n,\quad r(A)=n\ 1,\quad r(A)=n-1\ 0,\quad r(A)<n-1\end{cases}
6.有关\mathbf{A}^{\mathbf{- 1}}的结论
A可逆\Leftrightarrow AB = E; \Leftrightarrow |A| \neq 0; \Leftrightarrow r(A) = n;
\Leftrightarrow A可以表示为初等矩阵的乘积;\Leftrightarrow A;\Leftrightarrow Ax = 0。
7.有关矩阵秩的结论
(1) 秩r(A)=行秩=列秩;
(2) r(A_{m \times n}) \leq \min(m,n);
(3) A \neq 0 \Rightarrow r(A) \geq 1;
(4) r(A \pm B) \leq r(A) + r(B);
(5) 初等变换不改变矩阵的秩
(6) r(A) + r(B) - n \leq r(AB) \leq \min(r(A),r(B)),特别若AB = O
则:r(A) + r(B) \leq n
(7) 若A^{- 1}存在\Rightarrow r(AB) = r(B); 若B^{- 1}存在
\Rightarrow r(AB) = r(A);
若r(A_{m \times n}) = n \Rightarrow r(AB) = r(B); 若r(A_{m \times s}) = n\Rightarrow r(AB) = r\left( A \right)。
(8) r(A_{m \times s}) = n \Leftrightarrow Ax = 0只有零解
8.分块求逆公式
\begin{pmatrix} A & O \ O & B \ \end{pmatrix}^{- 1} = \begin{pmatrix} A^{-1} & O \ O & B^{- 1} \ \end{pmatrix}; \begin{pmatrix} A & C \ O & B \\end{pmatrix}^{- 1} = \begin{pmatrix} A^{- 1}& - A^{- 1}CB^{- 1} \ O & B^{- 1} \ \end{pmatrix};
\begin{pmatrix} A & O \ C & B \ \end{pmatrix}^{- 1} = \begin{pmatrix} A^{- 1}&{O} \ - B^{- 1}CA^{- 1} & B^{- 1} \\end{pmatrix}; \begin{pmatrix} O & A \ B & O \ \end{pmatrix}^{- 1} =\begin{pmatrix} O & B^{- 1} \ A^{- 1} & O \ \end{pmatrix}
这里A,B均为可逆方阵。
向量¶
1.有关向量组的线性表示
(1)\alpha_{1},\alpha_{2},\cdots,\alpha_{s}线性相关\Leftrightarrow至少有一个向量可以用其余向量线性表示。
(2)\alpha_{1},\alpha_{2},\cdots,\alpha_{s}线性无关,\alpha_{1},\alpha_{2},\cdots,\alpha_{s},\beta线性相关\Leftrightarrow \beta可以由\alpha_{1},\alpha_{2},\cdots,\alpha_{s}唯一线性表示。
(3) \beta可以由\alpha_{1},\alpha_{2},\cdots,\alpha_{s}线性表示
\Leftrightarrow r(\alpha_{1},\alpha_{2},\cdots,\alpha_{s}) =r(\alpha_{1},\alpha_{2},\cdots,\alpha_{s},\beta) 。
2.有关向量组的线性相关性
(1)部分相关,整体相关;整体无关,部分无关.
(2) ① n个n维向量
\alpha_{1},\alpha_{2}\cdots\alpha_{n}线性无关\Leftrightarrow \left|\left\lbrack \alpha_{1}\alpha_{2}\cdots\alpha_{n} \right\rbrack \right| \neq0, n个n维向量\alpha_{1},\alpha_{2}\cdots\alpha_{n}线性相关
\Leftrightarrow |\lbrack\alpha_{1},\alpha_{2},\cdots,\alpha_{n}\rbrack| = 0
。
② n + 1个n维向量线性相关。
③ 若\alpha_{1},\alpha_{2}\cdots\alpha_{S}线性无关,则添加分量后仍线性无关;或一组向量线性相关,去掉某些分量后仍线性相关。
3.有关向量组的线性表示
(1) \alpha_{1},\alpha_{2},\cdots,\alpha_{s}线性相关\Leftrightarrow至少有一个向量可以用其余向量线性表示。
(2) \alpha_{1},\alpha_{2},\cdots,\alpha_{s}线性无关,\alpha_{1},\alpha_{2},\cdots,\alpha_{s},\beta线性相关\Leftrightarrow\beta 可以由\alpha_{1},\alpha_{2},\cdots,\alpha_{s}唯一线性表示。
(3) \beta可以由\alpha_{1},\alpha_{2},\cdots,\alpha_{s}线性表示
\Leftrightarrow r(\alpha_{1},\alpha_{2},\cdots,\alpha_{s}) =r(\alpha_{1},\alpha_{2},\cdots,\alpha_{s},\beta)
4.向量组的秩与矩阵的秩之间的关系
设r(A_{m \times n}) =r,则A的秩r(A)与A的行列向量组的线性相关性关系为:
(1) 若r(A_{m \times n}) = r = m,则A的行向量组线性无关。
(2) 若r(A_{m \times n}) = r < m,则A的行向量组线性相关。
(3) 若r(A_{m \times n}) = r = n,则A的列向量组线性无关。
(4) 若r(A_{m \times n}) = r < n,则A的列向量组线性相关。
5.\mathbf{n}维向量空间的基变换公式及过渡矩阵
若\alpha_{1},\alpha_{2},\cdots,\alpha_{n}与\beta_{1},\beta_{2},\cdots,\beta_{n}是向量空间V的两组基,则基变换公式为:
(\beta_{1},\beta_{2},\cdots,\beta_{n}) = (\alpha_{1},\alpha_{2},\cdots,\alpha_{n})\begin{bmatrix} c_{11}& c_{12}& \cdots & c_{1n} \ c_{21}& c_{22}&\cdots & c_{2n} \ \cdots & \cdots & \cdots & \cdots \ c_{n1}& c_{n2} & \cdots & c_{{nn}} \\end{bmatrix} = (\alpha_{1},\alpha_{2},\cdots,\alpha_{n})C
其中C是可逆矩阵,称为由基\alpha_{1},\alpha_{2},\cdots,\alpha_{n}到基\beta_{1},\beta_{2},\cdots,\beta_{n}的过渡矩阵。
6.坐标变换公式
若向量\gamma在基\alpha_{1},\alpha_{2},\cdots,\alpha_{n}与基\beta_{1},\beta_{2},\cdots,\beta_{n}的坐标分别是
X = {(x_{1},x_{2},\cdots,x_{n})}^{T},
Y = \left( y_{1},y_{2},\cdots,y_{n} \right)^{T} 即: \gamma =x_{1}\alpha_{1} + x_{2}\alpha_{2} + \cdots + x_{n}\alpha_{n} = y_{1}\beta_{1} +y_{2}\beta_{2} + \cdots + y_{n}\beta_{n},则向量坐标变换公式为X = CY 或Y = C^{- 1}X,其中C是从基\alpha_{1},\alpha_{2},\cdots,\alpha_{n}到基\beta_{1},\beta_{2},\cdots,\beta_{n}的过渡矩阵。
7.向量的内积
(\alpha,\beta) = a_{1}b_{1} + a_{2}b_{2} + \cdots + a_{n}b_{n} = \alpha^{T}\beta = \beta^{T}\alpha
8.Schmidt正交化
若\alpha_{1},\alpha_{2},\cdots,\alpha_{s}线性无关,则可构造\beta_{1},\beta_{2},\cdots,\beta_{s}使其两两正交,且\beta_{i}仅是\alpha_{1},\alpha_{2},\cdots,\alpha_{i}的线性组合(i= 1,2,\cdots,n),再把\beta_{i}单位化,记\gamma_{i} =\frac{\beta_{i}}{\left| \beta_{i}\right|},则\gamma_{1},\gamma_{2},\cdots,\gamma_{i}是规范正交向量组。其中
\beta_{1} = \alpha_{1}, \beta_{2} = \alpha_{2} -\frac{(\alpha_{2},\beta_{1})}{(\beta_{1},\beta_{1})}\beta_{1} , \beta_{3} =\alpha_{3} - \frac{(\alpha_{3},\beta_{1})}{(\beta_{1},\beta_{1})}\beta_{1} -\frac{(\alpha_{3},\beta_{2})}{(\beta_{2},\beta_{2})}\beta_{2} ,
............
\beta_{s} = \alpha_{s} - \frac{(\alpha_{s},\beta_{1})}{(\beta_{1},\beta_{1})}\beta_{1} - \frac{(\alpha_{s},\beta_{2})}{(\beta_{2},\beta_{2})}\beta_{2} - \cdots - \frac{(\alpha_{s},\beta_{s - 1})}{(\beta_{s - 1},\beta_{s - 1})}\beta_{s - 1}
9.正交基及规范正交基
向量空间一组基中的向量如果两两正交,就称为正交基;若正交基中每个向量都是单位向量,就称其为规范正交基。
线性方程组¶
1.克莱姆法则
线性方程组\begin{cases} a_{11}x_{1} + a_{12}x_{2} + \cdots +a_{1n}x_{n} = b_{1} \ a_{21}x_{1} + a_{22}x_{2} + \cdots + a_{2n}x_{n} =b_{2} \ \quad\cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots \ a_{n1}x_{1} + a_{n2}x_{2} + \cdots + a_{{nn}}x_{n} = b_{n} \ \end{cases},如果系数行列式D = \left| A \right| \neq 0,则方程组有唯一解,x_{1} = \frac{D_{1}}{D},x_{2} = \frac{D_{2}}{D},\cdots,x_{n} =\frac{D_{n}}{D},其中D_{j}是把D中第j列元素换成方程组右端的常数列所得的行列式。
2. n阶矩阵A可逆\Leftrightarrow Ax = 0只有零解。\Leftrightarrow\forall b,Ax = b总有唯一解,一般地,r(A_{m \times n}) = n \Leftrightarrow Ax= 0只有零解。
3.非奇次线性方程组有解的充分必要条件,线性方程组解的性质和解的结构
(1) 设A为m \times n矩阵,若r(A_{m \times n}) = m,则对Ax =b而言必有r(A) = r(A \vdots b) = m,从而Ax = b有解。
(2) 设x_{1},x_{2},\cdots x_{s}为Ax = b的解,则k_{1}x_{1} + k_{2}x_{2}\cdots + k_{s}x_{s}当k_{1} + k_{2} + \cdots + k_{s} = 1时仍为Ax =b的解;但当k_{1} + k_{2} + \cdots + k_{s} = 0时,则为Ax =0的解。特别\frac{x_{1} + x_{2}}{2}为Ax = b的解;2x_{3} - (x_{1} +x_{2})为Ax = 0的解。
(3) 非齐次线性方程组{Ax} = b无解\Leftrightarrow r(A) + 1 =r(\overline{A}) \Leftrightarrow b不能由A的列向量\alpha_{1},\alpha_{2},\cdots,\alpha_{n}线性表示。
4.奇次线性方程组的基础解系和通解,解空间,非奇次线性方程组的通解
(1) 齐次方程组{Ax} = 0恒有解(必有零解)。当有非零解时,由于解向量的任意线性组合仍是该齐次方程组的解向量,因此{Ax}= 0的全体解向量构成一个向量空间,称为该方程组的解空间,解空间的维数是n - r(A),解空间的一组基称为齐次方程组的基础解系。
(2) \eta_{1},\eta_{2},\cdots,\eta_{t}是{Ax} = 0的基础解系,即:
1) \eta_{1},\eta_{2},\cdots,\eta_{t}是{Ax} = 0的解;
2) \eta_{1},\eta_{2},\cdots,\eta_{t}线性无关;
3) {Ax} = 0的任一解都可以由\eta_{1},\eta_{2},\cdots,\eta_{t}线性表出.
k_{1}\eta_{1} + k_{2}\eta_{2} + \cdots + k_{t}\eta_{t}是{Ax} = 0的通解,其中k_{1},k_{2},\cdots,k_{t}是任意常数。
矩阵的特征值和特征向量¶
特征值分解与特征向量¶
-
特征值分解可以得到特征值(eigenvalues)与特征向量(eigenvectors);
-
特征值表示的是这个特征到底有多重要,而特征向量表示这个特征是什么。
如果说一个向量\vec{v}是方阵A的特征向量,将一定可以表示成下面的形式:
A\nu = \lambda \nu
\lambda为特征向量\vec{v}对应的特征值。特征值分解是将一个矩阵分解为如下形式:
A=Q\sum Q^{-1}
其中,Q是这个矩阵A的特征向量组成的矩阵,\sum是一个对角矩阵,每一个对角线元素就是一个特征值,里面的特征值是由大到小排列的,这些特征值所对应的特征向量就是描述这个矩阵变化方向(从主要的变化到次要的变化排列)。也就是说矩阵A的信息可以由其特征值和特征向量表示。
奇异值与特征值有什么关系¶
那么奇异值和特征值是怎么对应起来的呢?我们将一个矩阵A的转置乘以A,并对A^TA求特征值,则有下面的形式:
(A^TA)V = \lambda V
这里V就是上面的右奇异向量,另外还有:
\sigma_i = \sqrt{\lambda_i}, u_i=\frac{1}{\sigma_i}AV
这里的\sigma就是奇异值,u就是上面说的左奇异向量。
奇异值\sigma跟特征值类似,在矩阵\sum中也是从大到小排列,而且\sigma的减少特别的快,在很多情况下,前10%甚至1%的奇异值的和就占了全部的奇异值之和的99%以上了。也就是说,我们也可以用前r(r远小于m、n)个的奇异值来近似描述矩阵,即部分奇异值分解:
A_{m\times n}\approx U_{m \times r}\sum_{r\times r}V_{r \times n}^T
右边的三个矩阵相乘的结果将会是一个接近于A的矩阵,在这儿,r越接近于n,则相乘的结果越接近于A。
1.矩阵的特征值和特征向量的概念及性质
(1) 设\lambda是A的一个特征值,则 {kA},{aA} + {bE},A^{2},A^{m},f(A),A^{T},A^{- 1},A^{*}有一个特征值分别为
{kλ},{aλ} + b,\lambda^{2},\lambda^{m},f(\lambda),\lambda,\lambda^{- 1},\frac{|A|}{\lambda},且对应特征向量相同(A^{T} 例外)。
(2)若\lambda_{1},\lambda_{2},\cdots,\lambda_{n}为A的n个特征值,则\sum_{i= 1}^{n}\lambda_{i} = \sum_{i = 1}^{n}a_{{ii}},\prod_{i = 1}^{n}\lambda_{i}= |A| ,从而|A| \neq 0 \Leftrightarrow A没有特征值。
(3)设\lambda_{1},\lambda_{2},\cdots,\lambda_{s}为A的s个特征值,对应特征向量为\alpha_{1},\alpha_{2},\cdots,\alpha_{s},
若: \alpha = k_{1}\alpha_{1} + k_{2}\alpha_{2} + \cdots + k_{s}\alpha_{s} ,
则: A^{n}\alpha = k_{1}A^{n}\alpha_{1} + k_{2}A^{n}\alpha_{2} + \cdots +k_{s}A^{n}\alpha_{s} = k_{1}\lambda_{1}^{n}\alpha_{1} +k_{2}\lambda_{2}^{n}\alpha_{2} + \cdots k_{s}\lambda_{s}^{n}\alpha_{s} 。
2.相似变换、相似矩阵的概念及性质
(1) 若A \sim B,则
1) A^{T} \sim B^{T},A^{- 1} \sim B^{- 1},,A^{} \sim B^{}
2) |A| = |B|,\sum_{i = 1}^{n}A_{{ii}} = \sum_{i =1}^{n}b_{{ii}},r(A) = r(B)
3) |\lambda E - A| = |\lambda E - B|,对\forall\lambda成立
3.矩阵可相似对角化的充分必要条件
(1)设A为n阶方阵,则A可对角化\Leftrightarrow对每个k_{i}重根特征值\lambda_{i},有n-r(\lambda_{i}E - A) = k_{i}
(2) 设A可对角化,则由P^{- 1}{AP} = \Lambda,有A = {PΛ}P^{-1},从而A^{n} = P\Lambda^{n}P^{- 1}
(3) 重要结论
1) 若A \sim B,C \sim D,则\begin{bmatrix} A & O \ O & C \\end{bmatrix} \sim \begin{bmatrix} B & O \ O & D \\end{bmatrix}.
2) 若A \sim B,则f(A) \sim f(B),\left| f(A) \right| \sim \left| f(B)\right|,其中f(A)为关于n阶方阵A的多项式。
3) 若A为可对角化矩阵,则其非零特征值的个数(重根重复计算)=秩(A)
4.实对称矩阵的特征值、特征向量及相似对角阵
(1)相似矩阵:设A,B为两个n阶方阵,如果存在一个可逆矩阵P,使得B =P^{- 1}{AP}成立,则称矩阵A与B相似,记为A \sim B。
(2)相似矩阵的性质:如果A \sim B则有:
1) A^{T} \sim B^{T}
2) A^{- 1} \sim B^{- 1} (若A,B均可逆)
3) A^{k} \sim B^{k} (k为正整数)
4) \left| {λE} - A \right| = \left| {λE} - B \right|,从而A,B
有相同的特征值
5) \left| A \right| = \left| B \right|,从而A,B同时可逆或者不可逆
6) 秩\left( A \right) =秩\left( B \right),\left| {λE} - A \right| =\left| {λE} - B \right|,A,B不一定相似
二次型¶
1.\mathbf{n}个变量\mathbf{x}{\mathbf{1}}\mathbf{,}\mathbf{x}{\mathbf{2}}\mathbf{,\cdots,}\mathbf{x}_{\mathbf{n}}的二次齐次函数
f(x_{1},x_{2},\cdots,x_{n}) = \sum_{i = 1}^{n}{\sum_{j =1}^{n}{a_{{ij}}x_{i}y_{j}}},其中a_{{ij}} = a_{{ji}}(i,j =1,2,\cdots,n),称为n元二次型,简称二次型. 若令x = \ \begin{bmatrix}x_{1} \ x_{1} \ \vdots \ x_{n} \ \end{bmatrix},A = \begin{bmatrix} a_{11}& a_{12}& \cdots & a_{1n} \ a_{21}& a_{22}& \cdots & a_{2n} \ \cdots &\cdots &\cdots &\cdots \ a_{n1}& a_{n2} & \cdots & a_{{nn}} \\end{bmatrix},这二次型f可改写成矩阵向量形式f =x^{T}{Ax}。其中A称为二次型矩阵,因为a_{{ij}} =a_{{ji}}(i,j =1,2,\cdots,n),所以二次型矩阵均为对称矩阵,且二次型与对称矩阵一一对应,并把矩阵A的秩称为二次型的秩。
2.惯性定理,二次型的标准形和规范形
(1) 惯性定理
对于任一二次型,不论选取怎样的合同变换使它化为仅含平方项的标准型,其正负惯性指数与所选变换无关,这就是所谓的惯性定理。
(2) 标准形
二次型f = \left( x_{1},x_{2},\cdots,x_{n} \right) =x^{T}{Ax}经过合同变换x = {Cy}化为f = x^{T}{Ax} =y^{T}C^{T}{AC}
y = \sum_{i = 1}^{r}{d_{i}y_{i}^{2}}称为 f(r \leq n)的标准形。在一般的数域内,二次型的标准形不是唯一的,与所作的合同变换有关,但系数不为零的平方项的个数由r(A)唯一确定。
(3) 规范形
任一实二次型f都可经过合同变换化为规范形f = z_{1}^{2} + z_{2}^{2} + \cdots z_{p}^{2} - z_{p + 1}^{2} - \cdots -z_{r}^{2},其中r为A的秩,p为正惯性指数,r -p为负惯性指数,且规范型唯一。
3.用正交变换和配方法化二次型为标准形,二次型及其矩阵的正定性
设A正定\Rightarrow {kA}(k > 0),A^{T},A^{- 1},A^{*}正定;|A| >0,A可逆;a_{{ii}} > 0,且|A_{{ii}}| > 0
A,B正定\Rightarrow A +B正定,但{AB},{BA}不一定正定
A正定\Leftrightarrow f(x) = x^{T}{Ax} > 0,\forall x \neq 0
\Leftrightarrow A的各阶顺序主子式全大于零
\Leftrightarrow A的所有特征值大于零
\Leftrightarrow A的正惯性指数为n
\Leftrightarrow存在可逆阵P使A = P^{T}P
\Leftrightarrow存在正交矩阵Q,使Q^{T}{AQ} = Q^{- 1}{AQ} =\begin{pmatrix} \lambda_{1} & & \ \begin{matrix} & \ & \ \end{matrix} &\ddots & \ & & \lambda_{n} \ \end{pmatrix},
其中\lambda_{i} > 0,i = 1,2,\cdots,n.正定\Rightarrow {kA}(k >0),A^{T},A^{- 1},A^{*}正定; |A| > 0,A可逆;a_{{ii}} >0,且|A_{{ii}}| > 0 。
参考文献¶
[1]Ian,Goodfellow,Yoshua,Bengio,Aaron...深度学习[M],人民邮电出版,2017
[2]周志华.机器学习[M].清华大学出版社,2016.
[3]同济大学数学系.高等数学(第七版)[M],高等教育出版社,2014.
[4]盛骤,试式千,潘承毅等编. 概率论与数理统计(第4版)[M],高等教育出版社,2008
评论