主要内容

高等代数 多项式与线性代数

9.3 正定二次型和正定矩阵

矩阵可以看作是数的推广,实对称矩阵(Hermite矩阵)可以类比于实数,本节中将要介绍的正定矩阵则与正实数有很多类似的性质。

子节 9.3.1 正定二次型和正定矩阵的定义与基本性质

本节中,我们以实二次型为例来展开正定二次型和正定矩阵的定义与性质。(这些定义和性质都可以自然推广到Hermite二次型和Hermite矩阵上。)

定义 9.3.1.

\(f(x_1, \ldots , x_n) = X^TAX\)是实二次型。如果对任意非零实向量 \(X = (a_1, \ldots , a_n)^T\), 恒有
\begin{equation*} f (a_1, \ldots , a_n) = X^TAX > 0, \end{equation*}
则称\(A\)正定矩阵, 称该二次型是正定二次型
从定义可知,若实二次型\(f(x_1, \ldots , x_n)\)是正定二次型,则\(f(x_1, \ldots , x_n)= 0\)当且仅当\(x_1=\cdots=x_n = 0\)。请思考上述命题的逆命题是否成立。
先来看一个有代表性的例子。

9.3.2. 标准二次型的正定性.

\(f(x_1, \ldots , x_n) = d_1x_1^2+\cdot+d_nx_n^2\)是一个标准二次型,其中\(d_i\in \R\)。则\(f\)是正定二次型当且仅当\(d_i > 0\)\(i=1,\ldots,n\))。
上例说明标准二次型(或对称矩阵)的正定性很容易判定,因此我们判定二次型正定性的第一种方法就是将其用可逆线性替换转化为标准型。
利用上述引理,我们有如下一组正定矩阵的等价条件。

证明.

下面通过几个例子进一步熟悉正定矩阵的性质。

9.3.5. 正定矩阵与矩阵运算.

  1. \(A,B\)是正定阵, 则\(A+B\)为正定阵;
  2. \(A\)是正定阵, \(k>0\), 则\(kA\)是正定阵;
  3. \(A\)\(B\)是正定阵,且\(AB = BA\), 则\(AB\)为正定阵;
  4. \(A\)是正定阵, 则\(A^{-1}\)\({\rm adj}A\)为正定阵。

9.3.6. 正定矩阵与扰动1.

设实二次型\(f (x_{1}, x_{2}, x_{3}) = X^{T}AX\)经过正交替换\(X = QY\)后化为标准形 \(f = y_{1}^{2}+y_{2}^{2}\), 且\(Q\)的第三列为\(\begin{pmatrix}\frac{\sqrt{2}}{2},0,\frac{\sqrt{2}}{2}\end{pmatrix}^{T}\)
  1. \(A\)
  2. 证明\(A+E\)为正定矩阵。

9.3.7. 正定矩阵与扰动2.

  1. \(A\)为实对称矩阵,则存在充分大的\(a\), 使得\(aE + A\)为正定阵。
  2. \(B\)\(m\times n\)阶实矩阵, 则对任意\(b>0\)\(bE+B^{T}B\)为正定阵。

子节 9.3.2 正定矩阵与行列式

正定矩阵的另一个常用判定条件是使用行列式给出的,矩阵的正定性与行列式大于0之间有密切联系,下面我们来揭示这种联系。首先,定理 9.3.4 有一个直接推论。
为了叙述正定性与行列式的联系,我们需要再引入几个术语。
\(A\)是一个\(n\)阶方阵,称
\begin{equation*} A \begin{bmatrix} i_1 & i_2 & \cdots & i_k\\ i_1 & i_2 & \cdots & i_k \end{bmatrix}=\begin{vmatrix} a_{i_1i_1} & a_{i_1i_2} & \cdots & a_{i_1i_k}\\ a_{i_2i_1} & a_{i_2i_2} & \cdots & a_{i_2i_k}\\ \vdots & \vdots & \ddots & \vdots\\ a_{i_ki_1} & a_{i_ki_2} & \cdots & a_{i_ki_k} \end{vmatrix} \end{equation*}
\(A\)\(k\)阶主子式。特别的,称
\begin{equation*} A \begin{bmatrix} 1 & 2 & \cdots & k\\ 1 & 2 & \cdots & k \end{bmatrix}=\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1k}\\ a_{21} & a_{22} & \cdots & a_{2k}\\ \vdots & \vdots & \ddots & \vdots\\ a_{k1} & a_{k2} & \cdots & a_{kk} \end{vmatrix} \end{equation*}
\(A\)\(k\)阶顺序主子式
主子式和一般子式的区别在于:一般子式选取子矩阵的行指标集\(i_1,\ldots,i_k\)和列指标集\(j_1,\ldots,j_k\)相互之间没有限制,而主子式中要求这两个集合是一样的。相应的,主子式中的对角元也是原矩阵的对角元。

证明.

9.3.10. 正定矩阵与主子式.

\(A = \begin{pmatrix} 2 & 1\\ 1 & 2 \end{pmatrix}\), 则\(A\)的所有主子式均大于0, 所以\(A\)是正定矩阵。

9.3.11. 由行列式确定正定性的应用.

\(a\)的取值范围, 使
\begin{align*} f(x_1,x_2,x_3,x_4)= \amp\ ax_1^2+ax_2^2+ax_3^2+x_4^2 \\ \amp+2x_1x_2+2x_1x_3-2x_2x_3 \end{align*}
为正定二次型。

子节 9.3.3 正定矩阵与内积*

正定矩阵与内积之间有密切的内在联系,本节中我们会说明欧式空间上的内积可以与正定矩阵之间建立一一对应关系。先介绍一个比内积更为一般的概念。

定义 9.3.12.

\(U\)是一个\(m\)维实线性空间,\(V\)是一个\(n\)维实线性空间,\(\phi:\ U\times V \to \R \)\(U\times V\)\(\R\)上的映射(此种映射也称为\(U,V\)上的二元函数)。若\(\phi\)关于它的两个变量都是线性的,即
  1. \(\forall X_1,X_2\in U,\ Y\in V,\ c_1,c_2\in \R\),都有
    \begin{equation*} \phi(c_1X_1+c_2X_2,Y) = c_1\phi(X_1,Y)+c_2\phi(X_2,Y); \end{equation*}
  2. \(\forall\ X\in U,\ Y_1,Y_2\in V,\ c_1,c_2\in \R\),都有
    \begin{equation*} \phi(X,c_1Y_1+c_2Y_2) = c_1\phi(X,Y_1)+c_2\phi(X,Y_2); \end{equation*}
则称\(\phi\)\(U,V\)上的双线性函数。特别的,若进一步有\(U=V\),则也称\(\phi\)\(V\)(或\(U\))上的数量积
容易看到,内积是一种特殊的双线性函数,同时也是一种特殊的数量积函数。内积定义中的性质2和性质3就是保障内积的双线性。
双线性函数是一个有广泛应用的概念。一个典型的例子是:牛顿力学中,作用在一个物体上的力和这个物体的位移两者产生功的过程可以用数量积描述。出于篇幅考虑,本书中我们只介绍一个空间上的数量积函数,即\(U=V\)的情况。
选定\(n\)维实线性空间\(V\)的一个基 \((\varepsilon_1,\ldots,\varepsilon_n) \),称矩阵
\begin{equation*} \begin{pmatrix} \phi(\varepsilon_1,\varepsilon_1) & \cdots & \phi(\varepsilon_1,\varepsilon_n) \\ \vdots & \ddots & \vdots\\ \phi(\varepsilon_n,\varepsilon_1) & \cdots & \phi(\varepsilon_n,\varepsilon_n) \\ \end{pmatrix} \end{equation*}
\(V\)上数量积函数\(\phi\)在基\((\varepsilon_1,\ldots,\varepsilon_n) \)下 的 度量矩阵
可知下面的结论成立。
上述命题说明:数量积函数可以由矩阵乘法来实现。
下面一个定理说明了内积与正定矩阵的关系。

证明.

子节 9.3.4 二次型的其它分类

除正定二次型外,二次型还有其它的一些常用分类。

定义 9.3.15.

\(f (x_1 , \ldots , x_n) = X^TAX\)是实二次型。
  • 如果对任意 \(X = (a_1, \ldots , a_n)^T \ne 0\), 恒有
    \begin{equation*} f (a_1, \ldots , a_n) = X^TAX {\color{blue} \ge} 0, \end{equation*}
    则称\(A\)半正定矩阵, 称该二次型是半正定二次型
  • 如果对任意 \(X = (a_1, a_2, \ldots , a_n)^T \ne 0\), 恒有
    \begin{equation*} f (a_1, a_2, \ldots , a_n) = X^TAX {\color{blue} <} 0, \end{equation*}
    则称\(A\)负定矩阵, 称该二次型是负定二次型
  • 如果对任意 \(X = (a_1, a_2, \ldots , a_n)^T \ne 0\), 恒有
    \begin{equation*} f (a_1, a_2, \ldots , a_n) = X^TAX {\color{blue} \le} 0, \end{equation*}
    则称\(A\)半负定矩阵, 称该二次型是半负定二次型
  • 若存在\(X_1= (a_1, a_2, \ldots , a_n)^T \ne 0\), 使\(X_1^TAX_1>0\), 且存在\(X_2= (b_1, b_2, \ldots , b_n)^T\ne 0\), 使\(X_2^TAX_2< 0\), 则\(A\)不定矩阵, 称该二次型是不定型
上述定义中,半正定矩阵及半正定二次型是在应用中常被使用的概念,其地位可以类比于实数中的非负数。
注意到若\(A\)是(半)负定矩阵,则\(-A\)就是(半)正定矩阵,所以我们只需关注(半)正定矩阵的性质。半正定矩阵有如下一些等价条件。
特别提示,\(A\)的所有顺序主子式全大等于0不能确保\(A\)是半正定矩阵,如下例所示。

9.3.17.

\begin{equation*} A = {\rm diag}(0,-1,\ldots,-1). \end{equation*}
\(A\)的所有顺序主子式全等于0,但\(A\)不是半正定矩阵。

练习 9.3.5 练习

基础题.

1.

提高题.

2.
\(A\)\(n\)阶正定矩阵,\(B\)\(n\times m\)矩阵,证明:\(B^TAB\)正定的充分必要条件是\(r(B)=m\)
3.
\(A=\begin{pmatrix} B&C\\ C^T&D \end{pmatrix}\)是正定矩阵,其中\(B\)\(n\)阶矩阵,\(D\)\(m\)阶矩阵,\(C\)\(n\times m\)矩阵,证明:\(B,\ D\)以及\(D-C^TB^{-1}C\)均是正定矩阵。
4.
\(A\)\(n\)阶正定矩阵,证明:\(\det (A+E)>1\)

挑战题.

5. 矩阵平方根.
\(A\)\(n\)阶半正定矩阵,证明:存在唯一一个半正定矩阵\(B\),使得\(A=B^2\)
6. 极分解.
\(A\in \C^{n\times n}\)。证明:存在半正定矩阵\(R\)和酉矩阵\(U\),使得
\begin{equation*} A = RU. \end{equation*}