主要内容\(\newcommand{\Ima}{\rm Im }
\newcommand{\N}{\mathbb N}
\newcommand{\Z}{\mathbb Z}
\newcommand{\Q}{\mathbb Q}
\newcommand{\R}{\mathbb R}
\newcommand{\F}{\mathbb F}
\newcommand{\C}{\mathbb C}
\newcommand{\K}{\mathbb K}
\newcommand{\myunit}{1 cm}
\newcommand{\blue}[1]{{\color{blue}#1}}
\newcommand\iddots{\mathinner{
\kern1mu\raise1pt{.}
\kern2mu\raise4pt{.}
\kern2mu\raise7pt{\Rule{0pt}{7pt}{0pt}.}
\kern1mu
}}
\tikzset{
node style sp/.style={draw,circle,minimum size=\myunit},
node style ge/.style={circle,minimum size=\myunit},
arrow style mul/.style={draw,sloped,midway,fill=white},
arrow style plus/.style={midway,sloped,fill=white},
}
\newcommand{\lt}{<}
\newcommand{\gt}{>}
\newcommand{\amp}{&}
\definecolor{fillinmathshade}{gray}{0.9}
\newcommand{\fillinmath}[1]{\mathchoice{\colorbox{fillinmathshade}{$\displaystyle \phantom{\,#1\,}$}}{\colorbox{fillinmathshade}{$\textstyle \phantom{\,#1\,}$}}{\colorbox{fillinmathshade}{$\scriptstyle \phantom{\,#1\,}$}}{\colorbox{fillinmathshade}{$\scriptscriptstyle\phantom{\,#1\,}$}}}
\)
节 9.3 正定二次型和正定矩阵
矩阵可以看作是数的推广,实对称矩阵可以类比于实数,本节中将要介绍的正定矩阵则与正实数有很多类似的性质。
子节 9.3.1 正定二次型和正定矩阵的定义与基本性质
定义 9.3.1.
设\(f(x_1, \ldots , x_n) = X^TAX\)是实二次型。如果对任意非零实向量 \(X = (a_1, \ldots , a_n)^T\), 恒有
\begin{equation*}
f (a_1, \ldots , a_n) = X^TAX > 0,
\end{equation*}
则称\(A\)是正定矩阵, 称该二次型是正定二次型。
可逆线性替换不会改变二次型的正定性,因此可以先用可逆线性替换化简二次型,当化简为标准型或规范型后,二次型(或对称矩阵)的正定性就容易判定了。
定理 9.3.2.
设\(A\)是\(n\)阶实对称矩阵,则下列命题等价:
\(A\)是正定矩阵;
\(A\)的正惯性指数为\(n\);
\(A\)合同于 \(n\) 阶单位矩阵;
存在\(n\)阶可逆矩阵 \(P\text{,}\) 使得 \(A = P^TP\);
\(A\)的特征值全大于0。
证明.
我们可得上述定理的一个直接推论。
推论 9.3.3.
设\(A\)是正定的,则\(\det A>0\)。
事实上矩阵的正定性与行列式之间有更为密切的联系。为了叙述这种联系,我们需要再引入几个术语。
设\(A\)是一个\(n\)阶方阵,称
\begin{equation*}
A \begin{bmatrix}
i_1 & i_2 & \cdots & i_k\\
i_1 & i_2 & \cdots & i_k
\end{bmatrix}=\begin{vmatrix}
a_{i_1i_1} & a_{i_1i_2} & \cdots & a_{i_1i_k}\\
a_{i_2i_1} & a_{i_2i_2} & \cdots & a_{i_2i_k}\\
\vdots & \vdots & \ddots & \vdots\\
a_{i_ki_1} & a_{i_ki_2} & \cdots & a_{i_ki_k}
\end{vmatrix}
\end{equation*}
为\(A\)的\(k\)阶主子式。特别的,称
\begin{equation*}
A \begin{bmatrix}
1 & 2 & \cdots & k\\
1 & 2 & \cdots & k
\end{bmatrix}=\begin{vmatrix}
a_{11} & a_{12} & \cdots & a_{1k}\\
a_{21} & a_{22} & \cdots & a_{2k}\\
\vdots & \vdots & \ddots & \vdots\\
a_{k1} & a_{k2} & \cdots & a_{kk}
\end{vmatrix}
\end{equation*}
为\(A\)的\(k\)阶顺序主子式。
主子式和一般子式的区别在于:一般子式选取子矩阵的行指标集\(i_1,\ldots,i_k\)和列指标集\(j_1,\ldots,j_k\)相互之间没有限制,而主子式中要求这两个集合是一样的。相应的,主子式中的对角元也是原矩阵的对角元。
定理 9.3.4.
设\(A\)是 \(n\)阶实对称矩阵,则下列条件等价:
\(A\)是正定矩阵;
\(A\)的所有主子式大于0;
\(A\)的所有顺序主子式大于零。
子节 9.3.2 正定矩阵与内积
我们先介绍一个比内积更为一般的概念。
定义 9.3.5.
设\(U\)是一个\(m\)维实线性空间,\(V\)是一个\(n\)维实线性空间,\(\phi:\ U\times V \to \R \)是\(U\times V\)到\(\R\)上的映射(此种映射也称为\(U,V\)上的二元函数)。若\(\phi\)关于它的两个变量都是线性的,即
对\(\forall X_1,X_2\in U,\ Y\in V,\ c_1,c_2\in \R\),都有
\begin{equation*}
\phi(c_1X_1+c_2X_2,Y) = c_1\phi(X_1,Y)+c_2\phi(X_2,Y);
\end{equation*}
对\(\forall\ X\in U,\ Y_1,Y_2\in V,\ c_1,c_2\in \R\),都有
\begin{equation*}
\phi(X,c_1Y_1+c_2Y_2) = c_1\phi(X,Y_1)+c_2\phi(X,Y_2);
\end{equation*}
则称\(\phi\)是\(U,V\)上的双线性函数。特别的,若进一步有\(U=V\),则也称\(\phi\)是\(V\)(或\(U\))上的数量积。
容易看到,内积是一种特殊的双线性函数,同时也是一种特殊的数量积函数。内积定义中的性质2和性质3就是保障内积的双线性。
双线性函数是一个有广泛应用的概念。出于篇幅考虑,本书中我们只介绍一个空间上的数量积函数,即\(U=V\)的情况。
选定\(n\)维实线性空间\(V\)的一个基 \(\varepsilon_1,\ldots,\varepsilon_n \),称矩阵
\begin{equation*}
\begin{pmatrix}
\phi(\varepsilon_1,\varepsilon_1) & \cdots & \phi(\varepsilon_1,\varepsilon_n) \\
\vdots & \ddots & \vdots\\
\phi(\varepsilon_n,\varepsilon_1) & \cdots & \phi(\varepsilon_n,\varepsilon_n) \\
\end{pmatrix}
\end{equation*}
为\(V\)上数量积函数\(\phi\)在基\(\varepsilon_1,\ldots,\varepsilon_n \)下 的 度量矩阵。
可知下面的结论成立。
命题 9.3.6.
设\(\phi\)是\(n\)维实线性空间\(V\)上数量积函数,\(\phi\)在\(V\)的一个基 \(\varepsilon_1,\ldots,\varepsilon_n \)下的度量矩阵为\(A\)。对\(\forall \alpha,\beta\in V\),记这两个向量在基\(\varepsilon_1,\ldots,\varepsilon_n \)下的坐标向量分别为\(X\)和\(Y\),则
\begin{equation*}
\phi(\alpha,\beta) = X^T A Y.
\end{equation*}
上述命题说明:数量积函数可以由矩阵乘法来实现。
下面一个定理说明了内积与正定矩阵的关系。
定理 9.3.7.
设\(\phi\)是\(n\)维实线性空间\(V\)上数量积函数,\(\phi\)在\(V\)的一个基 \(\varepsilon_1,\ldots,\varepsilon_n \)下的度量矩阵为\(A\)。则\(\phi\)是\(V\)上的内积当且仅当\(A\)是正定矩阵。
证明.
子节 9.3.3 二次型的其它分类
除正定二次型外,二次型还有其它的一些常用分类。
定义 9.3.8.
设 \(f (x_1 , \ldots , x_n) = X^TAX\)是实二次型。
如果对任意 \(X = (a_1, \ldots , a_n)^T \ne 0\), 恒有
\begin{equation*}
f (a_1, \ldots , a_n) = X^TAX {\color{blue} \ge} 0,
\end{equation*}
则称\(A\)是半正定矩阵, 称该二次型是半正定二次型。
如果对任意 \(X = (a_1, a_2, \ldots , a_n)^T \ne 0\), 恒有
\begin{equation*}
f (a_1, a_2, \ldots , a_n) = X^TAX {\color{blue} <} 0,
\end{equation*}
则称\(A\)是负定矩阵, 称该二次型是负定二次型。
如果对任意 \(X = (a_1, a_2, \ldots , a_n)^T \ne 0\), 恒有
\begin{equation*}
f (a_1, a_2, \ldots , a_n) = X^TAX {\color{blue} \le} 0,
\end{equation*}
则称\(A\)是半负定矩阵, 称该二次型是半负定二次型。
若存在\(X_1= (a_1, a_2, \ldots , a_n)^T \ne 0\), 使\(X_1^TAX_1>0\), 且存在\(X_2= (b_1, b_2, \ldots , b_n)^T\ne 0\), 使\(X_2^TAX_2< 0\), 则\(A\)是不定矩阵, 称该二次型是不定型。
上述定义中,半正定矩阵及半正定二次型是在应用中常被使用的概念,其地位可以类比于实数中的非负数。
注意到若\(A\)是(半)负定矩阵,则\(-A\)就是(半)正定矩阵,所以我们只需关注(半)正定矩阵的性质。半正定矩阵有如下一些等价条件。
定理 9.3.9.
设\(A\)是实对称矩阵, 则下列命题等价:
\(A\)是半正定矩阵;
\(A\)的正惯性指数\(p=r(A)\);
\(A\)的特征值全大等于0;
存在列数为\(n\)的矩阵\(C\), 使得 \(A = C^TC\);
\(A\)的所有主子式全大等于0。
特别提示,\(A\)的所有顺序主子式全大等于0不能确保\(A\)是半正定矩阵,如下例所示。
例 9.3.10.
\begin{equation*}
A = {\rm diag}(0,-1,\ldots,-1).
\end{equation*}
\(A\)的所有顺序主子式全等于0,但\(A\)不是半正定矩阵。
推论 9.3.11.
设\(A\)是半正定, 则\(\det A\ge0\)。
练习 9.3.4 练习
提高题.
2.
设\(A\)是\(n\)阶正定矩阵,\(B\)是\(n\times m\)矩阵,证明:\(B^TAB\)正定的充分必要条件是\(r(B)=m\)。
3.
设\(A=\begin{pmatrix}
B&C\\ C^T&D
\end{pmatrix}\)是正定矩阵,其中\(B\)是\(n\)阶矩阵,\(D\)是\(m\)阶矩阵,\(C\)是\(n\times m\)矩阵,证明:\(B,\ D\)以及\(D-C^TB^{-1}C\)均是正定矩阵。
4.
设\(A\)是\(n\)阶正定矩阵,证明:\(\det (A+E)>1\)。
挑战题.
5. 矩阵平方根.
设\(A\)是\(n\)阶半正定矩阵,证明:存在唯一一个半正定矩阵\(B\),使得\(A=B^2\)。
6. 极分解.
设\(A\in \C^{n\times n}\)。证明:存在半正定矩阵\(R\)和酉矩阵\(U\),使得
\begin{equation*}
A = RU.
\end{equation*}