主要内容

高等代数: 多项式与线性代数

9.3 正定二次型和正定矩阵

矩阵可以看作是数的推广,实对称矩阵可以类比于实数,本节中将要介绍的正定矩阵则与正实数有很多类似的性质。

子节 9.3.1 正定二次型和正定矩阵的定义与基本性质

定义 9.3.1.

\(f(x_1, \ldots , x_n) = X^TAX\)是实二次型。如果对任意非零实向量 \(X = (a_1, \ldots , a_n)^T\), 恒有
\begin{equation*} f (a_1, \ldots , a_n) = X^TAX > 0, \end{equation*}
则称\(A\)正定矩阵, 称该二次型是正定二次型
可逆线性替换不会改变二次型的正定性,因此可以先用可逆线性替换化简二次型,当化简为标准型或规范型后,二次型(或对称矩阵)的正定性就容易判定了。

证明.

我们可得上述定理的一个直接推论。
事实上矩阵的正定性与行列式之间有更为密切的联系。为了叙述这种联系,我们需要再引入几个术语。
\(A\)是一个\(n\)阶方阵,称
\begin{equation*} A \begin{bmatrix} i_1 & i_2 & \cdots & i_k\\ i_1 & i_2 & \cdots & i_k \end{bmatrix}=\begin{vmatrix} a_{i_1i_1} & a_{i_1i_2} & \cdots & a_{i_1i_k}\\ a_{i_2i_1} & a_{i_2i_2} & \cdots & a_{i_2i_k}\\ \vdots & \vdots & \ddots & \vdots\\ a_{i_ki_1} & a_{i_ki_2} & \cdots & a_{i_ki_k} \end{vmatrix} \end{equation*}
\(A\)\(k\)阶主子式。特别的,称
\begin{equation*} A \begin{bmatrix} 1 & 2 & \cdots & k\\ 1 & 2 & \cdots & k \end{bmatrix}=\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1k}\\ a_{21} & a_{22} & \cdots & a_{2k}\\ \vdots & \vdots & \ddots & \vdots\\ a_{k1} & a_{k2} & \cdots & a_{kk} \end{vmatrix} \end{equation*}
\(A\)\(k\)阶顺序主子式
主子式和一般子式的区别在于:一般子式选取子矩阵的行指标集\(i_1,\ldots,i_k\)和列指标集\(j_1,\ldots,j_k\)相互之间没有限制,而主子式中要求这两个集合是一样的。相应的,主子式中的对角元也是原矩阵的对角元。

子节 9.3.2 正定矩阵与内积

我们先介绍一个比内积更为一般的概念。

定义 9.3.5.

\(U\)是一个\(m\)维实线性空间,\(V\)是一个\(n\)维实线性空间,\(\phi:\ U\times V \to \R \)\(U\times V\)\(\R\)上的映射(此种映射也称为\(U,V\)上的二元函数)。若\(\phi\)关于它的两个变量都是线性的,即
  1. \(\forall X_1,X_2\in U,\ Y\in V,\ c_1,c_2\in \R\),都有
    \begin{equation*} \phi(c_1X_1+c_2X_2,Y) = c_1\phi(X_1,Y)+c_2\phi(X_2,Y); \end{equation*}
  2. \(\forall\ X\in U,\ Y_1,Y_2\in V,\ c_1,c_2\in \R\),都有
    \begin{equation*} \phi(X,c_1Y_1+c_2Y_2) = c_1\phi(X,Y_1)+c_2\phi(X,Y_2); \end{equation*}
则称\(\phi\)\(U,V\)上的双线性函数。特别的,若进一步有\(U=V\),则也称\(\phi\)\(V\)(或\(U\))上的数量积
容易看到,内积是一种特殊的双线性函数,同时也是一种特殊的数量积函数。内积定义中的性质2和性质3就是保障内积的双线性。
双线性函数是一个有广泛应用的概念。出于篇幅考虑,本书中我们只介绍一个空间上的数量积函数,即\(U=V\)的情况。
选定\(n\)维实线性空间\(V\)的一个基 \(\varepsilon_1,\ldots,\varepsilon_n \),称矩阵
\begin{equation*} \begin{pmatrix} \phi(\varepsilon_1,\varepsilon_1) & \cdots & \phi(\varepsilon_1,\varepsilon_n) \\ \vdots & \ddots & \vdots\\ \phi(\varepsilon_n,\varepsilon_1) & \cdots & \phi(\varepsilon_n,\varepsilon_n) \\ \end{pmatrix} \end{equation*}
\(V\)上数量积函数\(\phi\)在基\(\varepsilon_1,\ldots,\varepsilon_n \)下 的 度量矩阵
可知下面的结论成立。
上述命题说明:数量积函数可以由矩阵乘法来实现。
下面一个定理说明了内积与正定矩阵的关系。

证明.

子节 9.3.3 二次型的其它分类

除正定二次型外,二次型还有其它的一些常用分类。

定义 9.3.8.

\(f (x_1 , \ldots , x_n) = X^TAX\)是实二次型。
  • 如果对任意 \(X = (a_1, \ldots , a_n)^T \ne 0\), 恒有
    \begin{equation*} f (a_1, \ldots , a_n) = X^TAX {\color{blue} \ge} 0, \end{equation*}
    则称\(A\)半正定矩阵, 称该二次型是半正定二次型
  • 如果对任意 \(X = (a_1, a_2, \ldots , a_n)^T \ne 0\), 恒有
    \begin{equation*} f (a_1, a_2, \ldots , a_n) = X^TAX {\color{blue} <} 0, \end{equation*}
    则称\(A\)负定矩阵, 称该二次型是负定二次型
  • 如果对任意 \(X = (a_1, a_2, \ldots , a_n)^T \ne 0\), 恒有
    \begin{equation*} f (a_1, a_2, \ldots , a_n) = X^TAX {\color{blue} \le} 0, \end{equation*}
    则称\(A\)半负定矩阵, 称该二次型是半负定二次型
  • 若存在\(X_1= (a_1, a_2, \ldots , a_n)^T \ne 0\), 使\(X_1^TAX_1>0\), 且存在\(X_2= (b_1, b_2, \ldots , b_n)^T\ne 0\), 使\(X_2^TAX_2< 0\), 则\(A\)不定矩阵, 称该二次型是不定型
上述定义中,半正定矩阵及半正定二次型是在应用中常被使用的概念,其地位可以类比于实数中的非负数。
注意到若\(A\)是(半)负定矩阵,则\(-A\)就是(半)正定矩阵,所以我们只需关注(半)正定矩阵的性质。半正定矩阵有如下一些等价条件。
特别提示,\(A\)的所有顺序主子式全大等于0不能确保\(A\)是半正定矩阵,如下例所示。

9.3.10.

\begin{equation*} A = {\rm diag}(0,-1,\ldots,-1). \end{equation*}
\(A\)的所有顺序主子式全等于0,但\(A\)不是半正定矩阵。

练习 9.3.4 练习

基础题.

1.

提高题.

2.
\(A\)\(n\)阶正定矩阵,\(B\)\(n\times m\)矩阵,证明:\(B^TAB\)正定的充分必要条件是\(r(B)=m\)
3.
\(A=\begin{pmatrix} B&C\\ C^T&D \end{pmatrix}\)是正定矩阵,其中\(B\)\(n\)阶矩阵,\(D\)\(m\)阶矩阵,\(C\)\(n\times m\)矩阵,证明:\(B,\ D\)以及\(D-C^TB^{-1}C\)均是正定矩阵。
4.
\(A\)\(n\)阶正定矩阵,证明:\(\det (A+E)>1\)

挑战题.

5. 矩阵平方根.
\(A\)\(n\)阶半正定矩阵,证明:存在唯一一个半正定矩阵\(B\),使得\(A=B^2\)
6. 极分解.
\(A\in \C^{n\times n}\)。证明:存在半正定矩阵\(R\)和酉矩阵\(U\),使得
\begin{equation*} A = RU. \end{equation*}