主要内容

高等代数 多项式与线性代数

9.3 正定二次型和正定矩阵

矩阵可以看作是数的推广,实对称矩阵(Hermite矩阵)可以类比于实数,本节中将要介绍的正定矩阵则与正实数有很多类似的性质。

子节 9.3.1 定义与基本性质

本节中,我们以实二次型为例来展开正定二次型和正定矩阵的定义与性质。(这些定义和性质都可以自然推广到Hermite二次型和Hermite矩阵上。)

定义 9.3.1.

\(f(x_1, \ldots , x_n) = X^TAX\)是实二次型,其中\(A^T=A\) 。如果对任意非零实向量 \(X = (a_1, \ldots , a_n)^T\), 恒有
\begin{equation*} f (a_1, \ldots , a_n) = X^TAX > 0, \end{equation*}
则称\(A\)正定矩阵, 称该二次型是正定二次型
从定义可知,若实二次型\(f(x_1, \ldots , x_n)\)是正定二次型,则\(f(x_1, \ldots , x_n)= 0\)当且仅当\(x_1=\cdots=x_n = 0\)。请思考上述命题的逆命题是否成立。
先来看一个有代表性的例子。

9.3.2. 标准二次型的正定性.

\(f(x_1, \ldots , x_n) = d_1x_1^2+\cdots+d_nx_n^2\)是一个标准二次型,其中\(d_i\in \R\)。则\(f\)是正定二次型当且仅当\(d_i > 0\)\(i=1,\ldots,n\))。
上例说明标准二次型(或对称矩阵)的正定性很容易判定,因此我们判定二次型正定性的第一种方法就是将其用可逆线性替换转化为标准型。

证明.

\(f(X)\)是正定二次型,对任意非零实向量\(Y\),由\(P\)可逆知\(PY\)为非零实向量,故
\begin{equation*} g(Y) = f(PY) > 0. \end{equation*}
因此\(g(Y)\)是正定二次型。
反之,若\(g(Y)\)是正定二次型,由上面证明可知\(f(X)=g(P^{-1}X)\)也是正定二次型。
利用上述引理,我们有如下一组正定矩阵的等价条件。

证明.

\(1.\Leftrightarrow 2.\)\(n\)阶实对称矩阵\(A\),存在\(n\)阶可逆矩阵\(P\),使得
\begin{equation*} P^TAP=\begin{pmatrix} E_p & 0 & 0\\ 0 & -E_q & 0\\ 0 & 0 & 0 \end{pmatrix}. \end{equation*}
例 9.3.2\(\begin{pmatrix} E_p & 0 & 0\\ 0 & -E_q & 0\\ 0 & 0 & 0 \end{pmatrix}\)正定的充要条件是 \(p=n\)。因此由引理 9.3.3可知,\(A\)正定的充要条件是\(p=n\)
\(2.\Leftrightarrow 3.\) 由相关定义可知。
\(3.\Leftrightarrow 4.\) 按照定义,\(A\)合同于\(n\)阶单位矩阵的充要条件是存在\(n\)阶可逆矩阵\(P\),使得
\begin{equation*} A=P^TE_nP = P^TP. \end{equation*}
\(2.\Leftrightarrow 5.\) 注意到实对称矩阵的正惯性指数等于其正特征值个数,因此\(A\)的正惯性指数为\(n\)的充要条件是\(A\)的特征值全大于0。
下面通过几个例子进一步熟悉正定矩阵的性质。

9.3.5. 正定矩阵与矩阵运算.

  1. \(A,B\)是正定阵, 则\(A+B\)为正定阵;
  2. \(A\)是正定阵, \(k>0\), 则\(kA\)是正定阵;
  3. \(A\)\(B\)是正定阵,且\(AB = BA\), 则\(AB\)为正定阵;
  4. \(A\)是正定阵, 则\(A^{-1}\)\({\rm adj}A\)为正定阵。
解答.
  1. 对任意非零实向量\(X\),由\(A,B\)正定知:
    \begin{equation*} X^TAX > 0, X^TBX >0, \end{equation*}
    \begin{equation*} X^T(A+B)X = X^TAX + X^TBX >0, \end{equation*}
    由此可知实对称矩阵\(A+B\)是正定矩阵。
  2. 因为\(A\)是正定阵,所以存在可逆矩阵\(P\),使得
    \begin{equation*} A=P^TP. \end{equation*}
    \(k >0 \)知存在可逆矩阵\(\sqrt{k}P\),使得
    \begin{equation*} kA=\left(\sqrt{k}P\right)^T\left(\sqrt{k}P\right). \end{equation*}
    因此\(kA\)是正定矩阵。
  3. 因为\(A,B\)是实对称矩阵且\(AB=BA\),所以
    \begin{equation*} (AB)^T=B^TA^T=BA=AB, \end{equation*}
    \(AB\)为实对称矩阵。根据练习 8.4.5.7\(A,B\)可同步正交对角化,即存在正交矩阵\(Q\),使得
    \begin{equation*} Q^{-1}AQ=\begin{pmatrix} \lambda_1 & &\\ & \ddots &\\ & & \lambda_n \end{pmatrix},Q^{-1}BQ=\begin{pmatrix} \mu_1 & &\\ & \ddots &\\ & & \mu_n \end{pmatrix}, \end{equation*}
    \begin{equation*} Q^{-1}(AB)Q = \left(Q^{-1}AQ\right)\left(Q^{-1}BQ\right)=\begin{pmatrix} \lambda_1\mu_1 & &\\ & \ddots &\\ & & \lambda_n\mu_n \end{pmatrix}, \end{equation*}
    其中\(\lambda_1\mu_1,\ldots,\lambda_n\mu_n\)\(AB\)的全部特征值。注意到\(A,B\)是正定矩阵,所以\(\lambda_1,\ldots,\lambda_n,\mu_1,\ldots,\mu_n\)全大于0,故矩阵\(AB\)的特征值\(\lambda_1\mu_1,\ldots,\lambda_n\mu_n\)全大于0。从而\(AB\)是正定矩阵。
  4. 因为\(A\)是正定矩阵,所以\(A\)的特征值\(\lambda_1,\ldots ,\lambda_n\)全大于0,则\(A^{-1}\)的特征值\(\lambda_1^{-1},\ldots,\lambda_n^{-1}\)也全大于0。因此实对称矩阵\(A^{-1}\)为正定矩阵。
    由于
    \begin{equation*} \det A=\lambda_1\cdots\lambda_n >0, \end{equation*}
    所以\({\rm adj}A=(\det A)A^{-1}\)仍是正定矩阵。

9.3.6. 正定矩阵与扰动1.

设实二次型\(f (x_{1}, x_{2}, x_{3}) = X^{T}AX\)经过正交替换\(X = QY\)后化为标准形 \(f = y_{1}^{2}+y_{2}^{2}\), 且\(Q\)的第三列为\(\begin{pmatrix}\frac{\sqrt{2}}{2},0,\frac{\sqrt{2}}{2}\end{pmatrix}^{T}\)
  1. \(A\)
  2. 证明\(A+E\)为正定矩阵。
解答.
  1. 根据题设,有
    \begin{equation*} A=Q\begin{pmatrix} 1 & &\\ & 1 & \\ & & 0 \end{pmatrix}Q^T. \end{equation*}
    \(Q=(X_1,X_2,X_3)\),则
    \begin{equation*} A=X_1X_1^T+X_2X_2^T. \end{equation*}
    因为\(A\)是正交矩阵,有
    \begin{equation*} X_1X_1^T+X_2X_2^T+X_3X_3^T=E, \end{equation*}
    所以
    \begin{equation*} A=E-X_3X_3^T=\begin{pmatrix} \frac{1}{2} & 0 & -\frac{1}{2}\\ 0 & 1 & 0\\ -\frac{1}{2} & 0 & \frac{1}{2} \end{pmatrix}. \end{equation*}
  2. 因为\(A\)是实对称矩阵且\(A\)的特征值为\(1,1,0\),所以\(A+E\)是实对称矩阵且特征值为\(2,2,1\),全大于0,因此\(A+E\)是正定矩阵。

9.3.7. 正定矩阵与扰动2.

  1. \(A\)为实对称矩阵,则存在充分大的\(a\), 使得\(aE + A\)为正定阵。
  2. \(B\)\(m\times n\)阶实矩阵, 则对任意\(b>0\)\(bE+B^{T}B\)为正定阵。
解答.
  1. 因为\(A\)是实对称矩阵,所以\(A\)的特征值均为实数。设\(A\)的全部特征值为\(\lambda_1,\ldots,\lambda_n\),则\(aE+A\)的全部特征值为
    \begin{equation*} a+\lambda_1, \ldots, a+\lambda_n. \end{equation*}
    \(\lambda=\max\{|\lambda_1|,\ldots,|\lambda_n|\}\),则当 \(a>\lambda\)时,
    \begin{equation*} a+\lambda_i\geq a-|\lambda_i|\geq a-\lambda >0,\quad i=1,\ldots,n, \end{equation*}
    故实对称矩阵\(aE+A\)是正定矩阵。
  2. 对任意非零实向量\(X\),有
    \begin{equation*} X^T(bE+B^TB)X=b(X^TX)+(BX)^T(BX). \end{equation*}
    \(X\)非零可知\(X^TX>0,(BX)^T(BX)\geq 0\),则
    \begin{equation*} X^T(bE+B^TB)X>0, \end{equation*}
    因此实对称矩阵\(bE+B^{T}B\)为正定阵。

子节 9.3.2 正定矩阵与行列式

正定矩阵的另一个常用判定条件是使用行列式给出的,矩阵的正定性与行列式大于0之间有密切联系,下面我们来揭示这种联系。首先,定理 9.3.4 有一个直接推论。

证明.

根据定理 9.3.4,存在可逆矩阵\(P\),使得\(A=P^TP\)。因此
\begin{equation*} \det A=\det (P^T)\det P=(\det P)^2 >0. \end{equation*}
为了叙述正定性与行列式的联系,我们需要再引入几个术语。
\(A\)是一个\(n\)阶方阵,称
\begin{equation*} A \begin{bmatrix} i_1 & i_2 & \cdots & i_k\\ i_1 & i_2 & \cdots & i_k \end{bmatrix}=\begin{vmatrix} a_{i_1i_1} & a_{i_1i_2} & \cdots & a_{i_1i_k}\\ a_{i_2i_1} & a_{i_2i_2} & \cdots & a_{i_2i_k}\\ \vdots & \vdots & \ddots & \vdots\\ a_{i_ki_1} & a_{i_ki_2} & \cdots & a_{i_ki_k} \end{vmatrix} \end{equation*}
\(A\)\(k\)阶主子式。特别的,称
\begin{equation*} A \begin{bmatrix} 1 & 2 & \cdots & k\\ 1 & 2 & \cdots & k \end{bmatrix}=\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1k}\\ a_{21} & a_{22} & \cdots & a_{2k}\\ \vdots & \vdots & \ddots & \vdots\\ a_{k1} & a_{k2} & \cdots & a_{kk} \end{vmatrix} \end{equation*}
\(A\)\(k\)阶顺序主子式
主子式和一般子式的区别在于:一般子式选取子矩阵的行指标集\(i_1,\ldots,i_k\)和列指标集\(j_1,\ldots,j_k\)相互之间没有限制,而主子式中要求这两个集合是一样的。相应的,主子式中的对角元也是原矩阵的对角元。

证明.

\(1.\Rightarrow 2.\) 对任意给定的\(1\leq i_1 < \cdots < i_k\leq n\),定义\(k\)元二次型
\begin{equation*} f_k(x_{i_1},\ldots,x_{i_k})=X^TAX, \end{equation*}
这里\(X=(x_1,\ldots,x_n)^T\),其中
\begin{equation*} x_j=\left\{\begin{array}{ll} 0, & j\neq i_s,\\ x_{i_s} & j=i_s, \end{array}\right. \end{equation*}
\(f_k(x_{i_1},\ldots,x_{i_k})\)的矩阵为\(A\)\(k\)阶主子式 \(A \begin{bmatrix} i_1 & i_2 & \cdots & i_k\\ i_1 & i_2 & \cdots & i_k \end{bmatrix}\)对应的矩阵。 由\(A\)是正定矩阵可知\(f_k(x_{i_1},\ldots,x_{i_k})\)是正定二次型,根据推论 9.3.8\(f_k(x_{i_1},\ldots,x_{i_k})\)对应矩阵的行列式大于0,因此\(A\)\(k\)阶主子式
\begin{equation*} A \begin{bmatrix} i_1 & i_2 & \cdots & i_k\\ i_1 & i_2 & \cdots & i_k \end{bmatrix}>0. \end{equation*}
\(2.\Rightarrow 3.\) 显然成立。
\(3.\Rightarrow 1.\) 对实对称矩阵的阶数\(n\)作数学归纳法。
\(n=1\)时,已知\(a_{11} > 0\),故1阶方阵\(A=(a_{11})\)正定。
假设对\(n-1\)阶实对称矩阵结论成立,以下考察\(n\)阶实对称矩阵\(A\)的情形。将\(A\)按如下方式分块:
\begin{equation*} \begin{pmatrix} A_{n-1} & \alpha\\ \alpha^T & a_{nn} \end{pmatrix}, \end{equation*}
其中\(A_{n-1}\)\(n-1\)阶实对称矩阵。因为\(A_{n-1}\)的所有顺序主子式是\(A\)\(1\)\(n-1\)阶顺序主子式,根据已知条件,它们全大于0。由归纳假设,\(A_{n-1}\)是正定矩阵。于是,存在\(n-1\)阶可逆矩阵\(P\),使得
\begin{equation*} P^TA_{n-1}P=E_{n-1}. \end{equation*}
\begin{equation*} C=\begin{pmatrix} P & -A_{n-1}^{-1}\alpha\\ 0 & 1 \end{pmatrix}, \end{equation*}
\(C\)\(n\)阶可逆矩阵,且
\begin{equation*} \begin{array}{ccl} C^TAC & = & \begin{pmatrix} P^T & 0\\ -\alpha^TA_{n-1}^{-1} & 1 \end{pmatrix}\begin{pmatrix} A_{n-1} & \alpha\\ \alpha^T & a_{nn} \end{pmatrix}\begin{pmatrix} P & -A_{n-1}^{-1}\alpha\\ 0 & 1 \end{pmatrix}\\ & = & \begin{pmatrix} E_{n-1} & 0\\ 0 & a_{nn}-\alpha^TA_{n-1}^{-1}\alpha \end{pmatrix} \end{array} \end{equation*}
已知\(A\)\(n\)阶顺序主子式大于0,即\(\det A >0\),则
\begin{equation*} \det (C^TAC)=(\det C)^2(\det A)>0, \end{equation*}
\begin{equation*} a_{nn}-\alpha^TA_{n-1}^{-1} >0, \end{equation*}
由此可知\(C^TAC=\begin{pmatrix} E_{n-1} & 0\\ 0 & a_{nn}-\alpha^TA_{n-1}^{-1}\alpha \end{pmatrix}\)正定。根据引理 9.3.3\(A\)是正定矩阵。

9.3.10. 正定矩阵与主子式.

\(A = \begin{pmatrix} 2 & 1\\ 1 & 2 \end{pmatrix}\), 则\(A\)的所有主子式均大于0, 所以\(A\)是正定矩阵。

9.3.11. 由行列式确定正定性的应用.

\(a\)的取值范围, 使
\begin{align*} f(x_1,x_2,x_3,x_4)= \amp\ ax_1^2+ax_2^2+ax_3^2+x_4^2 \\ \amp+2x_1x_2+2x_1x_3-2x_2x_3 \end{align*}
为正定二次型。
解答.
\(f(x_1,x_2,x_3,x_4)\)的矩阵为
\begin{equation*} A=\begin{pmatrix} a & 1 & 1 & 0\\ 1 & a & -1 & 0\\ 1 & -1 & a & 0\\ 0 & 0 & 0 &1 \end{pmatrix}. \end{equation*}
\(A\)为正定矩阵的充要条件是\(A\)的顺序主子式都大于0。由
\begin{equation*} \begin{array}{c} \det A_1=a>0,\\ \det A_2=\begin{vmatrix} a & 1 \\ 1 & a \end{vmatrix}=a^2-1>0,\\ \det A_3 =\begin{vmatrix} a & 1 & 1 \\ 1 & a & -1 \\ 1 & -1 & a \end{vmatrix}=(a+1)^2(a-2)>0,\\ \det A_4=\begin{vmatrix} a & 1 & 1 & 0\\ 1 & a & -1 & 0\\ 1 & -1 & a & 0\\ 0 & 0 & 0 &1 \end{vmatrix}=(a+1)^2(a-2)>0, \end{array} \end{equation*}
解得\(a>2\)

子节 9.3.3 正定矩阵与内积*

正定矩阵与内积之间有密切的内在联系,本节中我们会说明欧式空间上的内积可以与正定矩阵之间建立一一对应关系。先介绍一个比内积更为一般的概念。

定义 9.3.12.

\(U\)是一个\(m\)维实线性空间,\(V\)是一个\(n\)维实线性空间,\(\phi:\ U\times V \to \R \)\(U\times V\)\(\R\)上的映射(此种映射也称为\(U,V\)上的二元函数)。若\(\phi\)关于它的两个变量都是线性的,即
  1. \(\forall X_1,X_2\in U,\ Y\in V,\ c_1,c_2\in \R\),都有
    \begin{equation*} \phi(c_1X_1+c_2X_2,Y) = c_1\phi(X_1,Y)+c_2\phi(X_2,Y); \end{equation*}
  2. \(\forall\ X\in U,\ Y_1,Y_2\in V,\ c_1,c_2\in \R\),都有
    \begin{equation*} \phi(X,c_1Y_1+c_2Y_2) = c_1\phi(X,Y_1)+c_2\phi(X,Y_2); \end{equation*}
则称\(\phi\)\(U,V\)上的双线性函数。特别的,若进一步有\(U=V\),则也称\(\phi\)\(V\)(或\(U\))上的数量积
容易看到,内积是一种特殊的双线性函数,同时也是一种特殊的数量积函数。内积定义中的性质2和性质3就是保障内积的双线性。
双线性函数是一个有广泛应用的概念。一个典型的例子是:牛顿力学中,作用在一个物体上的力和这个物体的位移两者产生功的过程可以用数量积描述。出于篇幅考虑,本书中我们只介绍一个空间上的数量积函数,即\(U=V\)的情况。
选定\(n\)维实线性空间\(V\)的一个基 \((\xi_1,\ldots,\xi_n) \),称矩阵
\begin{equation*} \begin{pmatrix} \phi(\xi_1,\xi_1) & \cdots & \phi(\xi_1,\xi_n) \\ \vdots & \ddots & \vdots\\ \phi(\xi_n,\xi_1) & \cdots & \phi(\xi_n,\xi_n) \\ \end{pmatrix} \end{equation*}
\(V\)上数量积函数\(\phi\)在基\((\xi_1,\ldots,\xi_n) \)下 的 度量矩阵
可知下面的结论成立。

证明.

\(X=(x_1,\ldots,x_n)^T,Y=(y_1,\ldots,y_n)^T\),则
\begin{equation*} \alpha=\sum\limits_{i=1}^n x_i\xi_i,\beta=\sum\limits_{j=1}^n y_j\xi_j. \end{equation*}
因为\(\phi\)\(V\)上数量积函数,所以
\begin{equation*} \begin{array}{ccl} \phi(\alpha,\beta) & = & \phi(\sum\limits_{i=1}^n x_i\xi_i,\sum\limits_{j=1}^n y_j\xi_j)\\ & =& \sum\limits_{i=1}^n\sum\limits_{j=1}^n x_iy_j(\phi(\xi_i),\phi(\xi_j))\\ & = & X^TAY. \end{array} \end{equation*}
上述命题说明:数量积函数可以由矩阵乘法来实现。
下面一个定理说明了内积与正定矩阵的关系。

证明.

\(\begin{array}{cl} & A=\left(\phi(\xi_i,\xi_j)\right)_{n\times n}\text{是正定矩阵}\\ \Leftrightarrow & A\text{是实对称矩阵,且对任意非零实向量}X\text{,有}X^TAX >0\\ \Leftrightarrow & \phi(\xi_i,\xi_j)=\phi(\xi_j,\xi_i),i,j=1,\ldots,n\text{,且对任意非零实向量}\\ & X=(x_1,\ldots,x_n)^T\text{,有}\phi(\sum\limits_{i=1}^n x_i\xi_i,\sum\limits_{i=1}^n x_i\xi_i)>0\\ \Leftrightarrow & \text{对任意}\alpha,\beta\in V\text{,}\phi(\alpha,\beta)=\phi(\beta,\alpha)\text{,且对任意}0\neq \gamma\in V\text{,}\phi(\gamma,\gamma)>0\\ \Leftrightarrow & \phi\text{是}V\text{上的内积。} \end{array}\)

子节 9.3.4 二次型的其它分类

除正定二次型外,二次型还有其它的一些常用分类。

定义 9.3.15.

\(f (x_1 , \ldots , x_n) = X^TAX\)是实二次型,其中\(A^T=A\)
  • 如果对任意非零实向量 \(X = (a_1, \ldots , a_n)^T \), 恒有
    \begin{equation*} f (a_1, \ldots , a_n) = X^TAX {\color{blue} \ge} 0, \end{equation*}
    则称\(A\)半正定矩阵, 称该二次型是半正定二次型
  • 如果对任意非零实向量 \(X = (a_1, a_2, \ldots , a_n)^T \), 恒有
    \begin{equation*} f (a_1, a_2, \ldots , a_n) = X^TAX {\color{blue} <} 0, \end{equation*}
    则称\(A\)负定矩阵, 称该二次型是负定二次型
  • 如果对任意非零实向量 \(X = (a_1, a_2, \ldots , a_n)^T \), 恒有
    \begin{equation*} f (a_1, a_2, \ldots , a_n) = X^TAX {\color{blue} \le} 0, \end{equation*}
    则称\(A\)半负定矩阵, 称该二次型是半负定二次型
  • 若存在非零实向量\(X_1= (a_1, a_2, \ldots , a_n)^T \), 使\(X_1^TAX_1>0\), 且存在非零实向量\(X_2= (b_1, b_2, \ldots , b_n)^T\), 使\(X_2^TAX_2< 0\), 则称\(A\)不定矩阵, 称该二次型是不定型
上述定义中,半正定矩阵及半正定二次型是在应用中常被使用的概念,其地位可以类比于实数中的非负数。
注意到若\(A\)是(半)负定矩阵,则\(-A\)就是(半)正定矩阵,所以我们只需关注(半)正定矩阵的性质。半正定矩阵有如下一些等价条件。

证明.

\(1.\Rightarrow 2.\) 因为\(A\)\(n\)阶实对称矩阵,所以存在可逆矩阵\(P\),使得
\begin{equation*} P^TAP=\begin{pmatrix} E_p & & \\ & -E_q &\\ & &0 \end{pmatrix}. \end{equation*}
假设\(A\)的正惯性指数\(p< r(A)\)。 取\(X=P\varepsilon_{p+1}\)\(\varepsilon_{p+1}\)是第\(p+1\)个元素是1,其余元素为0的标准单位向量),则\(X\)是非零实向量,且
\begin{equation*} X^TAX=\varepsilon_{p+1}^T(P^TAP)\varepsilon_{p+1}=-1 < 0, \end{equation*}
\(A\)是半正定矩阵相矛盾。
\(2.\Rightarrow 3.\) 由于实对称矩阵的正、负惯性指数分别等于其正、负特征值个数,所以当\(p=r(A)\)时,\(A\)的特征值全大等于0。
\(3.\Rightarrow 1.\) 因为\(A\)是特征值全大等于0的实对称矩阵,所以存在正交矩阵\(Q\),使得
\begin{equation*} A=Q^T\begin{pmatrix}\lambda_1 & &\\& \ddots &\\& & \lambda_n \end{pmatrix}Q, \end{equation*}
其中\(\lambda_1,\ldots,\lambda_n\)全大等于0。对任意非零实向量\(X\), 由\(Q\)可逆知\(QX\)非零。设\(QX=(y_1,\ldots,y_n)^T\),则
\begin{equation*} X^TAX=X^TQ^T\begin{pmatrix}\lambda_1 & &\\& \ddots &\\& & \lambda_n \end{pmatrix}QX=\lambda_1y_1^2+\cdots+\lambda_ny_n^2\geq 0. \end{equation*}
因此\(A\)是半正定矩阵。
\(1. \Rightarrow 4.\) 因为\(A\)\(n\)阶半正定矩阵,所以存在\(n\)阶可逆实矩阵\(P\),使得
\begin{equation*} A=P^T\begin{pmatrix}E_p&0\\0&0\end{pmatrix}P. \end{equation*}
\(C=\begin{pmatrix}E_p&0\\0&0\end{pmatrix}P\),则\(C\)\(n\)阶实方阵且\(A=C^TC\)
\(4.\Rightarrow 1.\) 对任意\(n\)维非零实向量\(X\),因为\(C\)是列数为\(n\)的实矩阵,所以
\begin{equation*} X^TAX=X^T(C^TC)X=(CX)^T(CX)\geq 0. \end{equation*}
因此\(A\)为半正定矩阵。

证明.

根据定理 9.3.16中的等价条件3,\(A\)的所有特征值\(\lambda_1,\dots,\lambda_n\)均大于等于0,故
\begin{equation*} \det A=\lambda_1 \cdots\lambda_n\geq 0. \end{equation*}

证明.

充分性:设\(A\)的特征多项式为
\begin{equation*} f_A(\lambda)=\lambda^n-b_1\lambda^{n-1}+b_2\lambda^{n-2}-\cdots+(-1)^{n}b_n. \end{equation*}
根据练习 3.3.6.13\(b_k\)\(A\)的所有\(k\)阶主子式之和。由于\(A\)的所有主子式全大等于0,所以\(b_k\geq 0,k=1,\ldots ,n\),故对任意\(c\in\mathbb{R}^-\)
\begin{equation*} f_A(c)=(-1)^n\left[(-c)^n+b_1(-c)^{n-1}+b_2(-c)^{n-2}+\cdots+b_n\right]\neq 0. \end{equation*}
因此\(A\)的特征值全大等0,从而\(A\)是半正定矩阵。
必要性:对任意给定的\(1\leq i_1 < \cdots < i_k\leq n\),定义\(k\)元二次型
\begin{equation*} f_k(x_{i_1},\ldots,x_{i_k})=X^TAX, \end{equation*}
这里\(X=(x_1,\ldots,x_n)^T\),其中
\begin{equation*} x_j=\left\{\begin{array}{ll} 0, & j\neq i_s,\\ x_{i_s} & j=i_s, \end{array}\right. \end{equation*}
\(f_k(x_{i_1},\ldots,x_{i_k})\)的矩阵为\(A\)\(k\)阶主子式 \(A \begin{bmatrix} i_1 & i_2 & \cdots & i_k\\ i_1 & i_2 & \cdots & i_k \end{bmatrix}\)对应的矩阵。 由\(A\)是半正定矩阵可知\(f_k(x_{i_1},\ldots,x_{i_k})\)是半正定二次型,根据推论 9.3.17\(f_k(x_{i_1},\ldots,x_{i_k})\)对应矩阵的行列式大等于0,因此\(A\)\(k\)阶主子式
\begin{equation*} A \begin{bmatrix} i_1 & i_2 & \cdots & i_k\\ i_1 & i_2 & \cdots & i_k \end{bmatrix}\geq 0. \end{equation*}
特别提示,\(A\)的所有顺序主子式全大等于0不能确保\(A\)是半正定矩阵,如下例所示。

9.3.19.

\begin{equation*} A = {\rm diag}(0,-1,\ldots,-1). \end{equation*}
\(A\)的所有顺序主子式全等于0,但\(A\)不是半正定矩阵。

练习 9.3.5 练习

基础题.

1.
\(A,B\)\(n\)阶正定矩阵,证明:\(BAB\)也是正定矩阵。
2.
\(A\)\(n\)阶正定矩阵,证明:\(\det (A+E)>1\)
3.
判断下列二次型是否正定:
  1. \(f(x_1,x_2,x_3)=x_1^2+2x_2^2+3x_3^2+2x_1x_2-4x_2x_3\)
  2. \(f(x_1,x_2,x_3)=2x_1x_2+4x_1x_3+6x_2x_3\)
  3. \(f(x_1,x_2,x_3)=x_1^2+2x_1x_2-2x_1x_3+2x_2^2-6x_2x_3+8x_3^2\)
4.
当且仅当\(t\)取何值时,下列二次型是正定的:
  1. \(f(x_1,x_2,x_3)=x_1^2+x_2^2+5x_3^2-2tx_1x_2+2x_1x_3-2x_2x_3\)
  2. \(f(x_1,x_2,x_3)=x_1^2+x_2^2+x_3^2+2t(x_1x_2+x_1x_3+x_2x_3)\)
5.
当且仅当\(t\)取何值时,二次型
\begin{equation*} f(x_1,x_2,x_3)=-x_1^2-x_2^2-5x_3^2+2tx_1x_2-2x_1x_3+4x_2x_3 \end{equation*}
是负定二次型。

提高题.

6.
\(A=(a_{ij})\)\(n\)阶正定矩阵,证明:
  1. \(a_{ii} >0,\ i=1,\ldots,n\)
  2. \(2|a_{ij}|< a_{ii}+a_{jj},\ i\neq j\)
  3. \(A\)的所有元素中,绝对值最大的元素一定在主对角线上。
7.
\(A\)\(n\)阶正定矩阵,\(B\)\(n\times m\)实矩阵,证明:\(B^TAB\)正定的充分必要条件是\(r(B)=m\)
8.
\(A=\left(a_{ij}\right)\)\(n\times m\)实矩阵,
\begin{equation*} f(x_1,\ldots ,x_m)=\sum\limits_{i=1}^n(a_{i1}x_1+a_{i2}x_2+\cdots+a_{im}x_m). \end{equation*}
证明:\(f(x_1,\ldots,x_m)\)正定的充分必要条件是\(A\)为列满秩矩阵。
9.
\(A=\begin{pmatrix} B&C\\ C^T&D \end{pmatrix}\)是正定矩阵,其中\(B\)\(n\)阶矩阵,\(D\)\(m\)阶矩阵,\(C\)\(n\times m\)矩阵,证明:\(B,\ D\)以及\(D-C^TB^{-1}C\)均是正定矩阵。
10.
\(A=(a_{ij})\)\(n\)阶正定矩阵,证明
  1. \(\det A\leq a_{nn}A\begin{bmatrix} 1 & 2 & \cdots & n-1\\ 1 & 2 & \cdots & n-1 \end{bmatrix}\)
  2. \(\det A\leq a_{11}a_{22}\cdots a_{nn}\)
11.
\(P=(p_{ij})\)\(n\)阶可逆矩阵,证明:
\begin{equation*} (\det P)^2\leq \prod\limits_{j=1}^n (p_{1j}^2+p_{2j}^2+\cdots +p_{nj}^2). \end{equation*}
12.
\(A\)\(n\)阶正定矩阵,证明:对任意非零向量\(\alpha\in\mathbb{C}^n\),有\(\alpha^HA\alpha >0\)
13.
\(V\)\(n\)维欧氏空间,证明:对任意一个\(n\)阶正定矩阵\(A\),都存在\(V\)的一组基\(\xi_1,\ldots,\xi_n\),使得\(\xi_1,\ldots,\xi_n\)的度量矩阵为\(A\)
14.
\begin{equation*} f(x_1,\ldots ,x_n)=n\sum\limits_{i=1}^nx_i^2-\left(\sum\limits_{i=1}^n x_i\right)^2. \end{equation*}
证明:\(f(x_1,\ldots ,x_n)\)是半正定二次型。
15.
\(A\)\(n\)阶半正定矩阵,\(X\in\mathbb{R}^n\),证明:\(X^TAX=0\)当且仅当\(AX=0\)
16.
\(A=(a_{ij})\)\(n\)阶半正定矩阵,令
\begin{equation*} A_k=\begin{pmatrix} a_{11}& \cdots & a_{1k}\\ \vdots & & \vdots\\ a_{k1} & \cdots & a_{kk} \end{pmatrix}, \end{equation*}
证明:若\(\det A_k\neq 0\),则\(A_k\)是正定矩阵。
17.
\(A\)\(n\)阶实对称矩阵,证明:存在\(n\)阶正定矩阵\(B\)和负定矩阵\(C\),使得
\begin{equation*} A=B+C. \end{equation*}

挑战题.

18. 矩阵平方根.
\(A\)\(n\)阶半正定矩阵,证明:存在唯一一个半正定矩阵\(B\),使得\(A=B^2\)
19. 极分解.
\(A\in \C^{n\times n}\)。证明:存在半正定矩阵\(R\)和酉矩阵\(U\),使得
\begin{equation*} A = RU. \end{equation*}
20. 第四届全国大学生数学竞赛初赛.
\(A,B,C\)\(n\)阶正定矩阵,
\begin{equation*} P(t)=At^2+Bt+C,\ f(t)=\det P(t), \end{equation*}
其中\(t\)为未定元。证明:若\(\lambda\)\(f(t)\)的根,则\(Re(\lambda)< 0\),这里\(Re(\lambda)\)表示\(\lambda\)的实部。