主要内容

高等代数 多项式与线性代数

9.2 合同变换和惯性定理

利用正交线性替换化简二次型虽然在理论上很完美,但由于实对称矩阵的正交对角化并不是非常容易获得(实际应用中通常由数值迭代算法计算),因此有必要研究利用一般线性替换化简二次型,即一般的合同关系。本节讨论合同变换的不变量,即在合同变换下矩阵的哪些性质是保持不变的。

子节 9.2.1 合同与初等变换

我们先从初等变换的角度来理解合同变换。

9.2.1.

从初等变换的角度理解
\begin{equation*} E(j,k)^TAE(j,k), E(j(c))^TAE(j(c)), E(j,k(c))^TAE(j,k(c)). \end{equation*}
解答.
注意到
\begin{equation*} E(j,k)^T=E(j,k), E(j(c))^T=E(j(c)), E(j,k(c))^T=E(k,j(c)), \end{equation*}
所以
\begin{equation*} E(j,k)^TAE(j,k)=\begin{pmatrix} a_{11} & \cdots & a_{1k} & \cdots & a_{1j} & \cdots & a_{1n}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{k1} & \cdots & a_{kk} & \cdots & a_{kj} & \cdots & a_{kn}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{j1} & \cdots & a_{jk} & \cdots & a_{jj} & \cdots & a_{jn}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots & a_{nk} & \cdots & a_{nj} & \cdots & a_{nn} \end{pmatrix} \end{equation*}
是对换\(A\)的第\(j\)行与第\(k\)行,再对换第\(j\)列与第\(k\)列所得;
\begin{equation*} E(j(c))^TAE(j(c))=\begin{pmatrix} a_{11} & \cdots & ca_{1j} & \cdots & a_{1n}\\ \vdots & & \vdots & & \vdots\\ ca_{j1} & \cdots & c^2a_{jj} & \cdots & ca_{jn}\\ \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots & ca_{nj} & \cdots & a_{nn} \end{pmatrix} \end{equation*}
是将\(A\)的第\(j\)行乘以非零常数\(c\),再将第\(j\)列乘以相同的常数\(c\)所得;
\begin{equation*} E(j,k(c))^TAE(j,k(c))=\begin{pmatrix} a_{11} & \cdots & a_{1j} & \cdots & a_{1k}+ca_{1j} & \cdots & a_{1n}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{j1} & \cdots & a_{jj} & \cdots & a_{jk}+ca_{jj} & \cdots & a_{jn}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{k1}+ca_{j1} & \cdots & a_{kj}+ca_{jj} & \cdots & a_{kk}+ca_{jk}+c\left(a_{kj}+ca_{jj}\right) & \cdots & a_{kn}+ca_{jn}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots & a_{nj} & \cdots & a_{nk}+ca_{nj} & \cdots & a_{nn} \end{pmatrix} \end{equation*}
是将\(A\)的第\(j\)行乘以\(c\)加到第\(k\)行上,再将第\(j\)列乘以\(c\)加到第\(k\)列上所得。
\(A\)实施上述三种变换也称为对\(A\)实施相应的同步行列初等变换。下面我们来举例说明如何使用同步行列初等变换的方法化简二次型。

9.2.3.

用合同变换将\(A=\begin{pmatrix} 0 & 2 & 2\\ 2 & 3 & 4\\ 2 & 4 & 3 \end{pmatrix}\)化为对角矩阵。
解答.
对换\(A\)的第\(1\)行与第\(2\)行,再对换第\(2\)列与第\(1\)列,所得矩阵\(A_1\)的第1行第1列元素非零。
\begin{equation*} A\rightarrow \begin{pmatrix} 2 & 3 & 4\\ 0 & 2 & 2\\ 2 & 4 & 3 \end{pmatrix}\rightarrow\begin{pmatrix} 3 & 2 & 4\\ 2 & 0 & 2\\ 4 & 2 & 3 \end{pmatrix}\triangleq A_1. \end{equation*}
\(A_1\)的第\(1\)行乘以\(-\frac{2}{3}\)加到第\(2\)行上,再将第\(1\)列乘以\(-\frac{2}{3}\)加到第\(2\)列上,得
\begin{equation*} A_1\rightarrow \begin{pmatrix} 3 & 2 & 4\\ 0 & -\frac{4}{3} & -\frac{2}{3}\\ 4 & 2 & 3 \end{pmatrix}\rightarrow\begin{pmatrix} 3 & 0 & 4\\ 0 & -\frac{4}{3} & -\frac{2}{3}\\ 4 & -\frac{2}{3} & 3 \end{pmatrix}\triangleq A_2. \end{equation*}
\(A_2\)的第\(1\)行乘以\(-\frac{4}{3}\)加到第\(3\)行上,再将第\(1\)列乘以\(-\frac{4}{3}\)加到第\(3\)列上,得
\begin{equation*} A_2\rightarrow \begin{pmatrix} 3 & 2 & 4\\ 0 & -\frac{4}{3} & -\frac{2}{3}\\ 0 & -\frac{2}{3} & -\frac{7}{3} \end{pmatrix}\rightarrow\begin{pmatrix} 3 & 0 & 0\\ 0 & -\frac{4}{3} & -\frac{2}{3}\\ 0 & -\frac{2}{3} & -\frac{7}{3} \end{pmatrix}\triangleq A_3. \end{equation*}
\(A_3\)的第\(2\)行乘以\(-\frac{1}{2}\)加到第\(3\)行上,再将第\(2\)列乘以\(-\frac{1}{2}\)加到第\(3\)列上,得
\begin{equation*} A_3\rightarrow \begin{pmatrix} 3 & 2 & 4\\ 0 & -\frac{4}{3} & -\frac{2}{3}\\ 0 & 0 & -2 \end{pmatrix}\rightarrow\begin{pmatrix} 3 & 0 & 0\\ 0 & -\frac{4}{3} & 0\\ 0 & 0 & -2 \end{pmatrix}. \end{equation*}
上述例子中,我们使用不为0的对角元将所有的非对角元消为0。注意到同步行列置换前后,矩阵的对角元只是位置发生了改变。若原矩阵中没有非0对角元,则只用行列同步对换和行列同步倍法变换不会产生非0对角元。下面的例子说明如何处理这种情形。

9.2.4.

用合同变换将\(A=\begin{pmatrix} 0 & 1 & 1\\ 1 & 0 & 1\\ 1 & 1 & 0 \end{pmatrix}\)化为对角矩阵。
解答.
注意到\(A\)的第2行第1列元素非零,所以将\(A\)的第2行加到第1行上,再将第2列加到第1列上,所得矩阵的第1行第1列元素非零。
\begin{equation*} A\rightarrow\begin{pmatrix} 1 & 1 & 2\\ 1 & 0 & 1\\ 1 & 1 & 0 \end{pmatrix}\rightarrow\begin{pmatrix} 2 & 1 & 2\\ 1 & 0 & 1\\ 2 & 1 & 0 \end{pmatrix}\triangleq A_1. \end{equation*}
\(A_1\)的第\(1\)行乘以\(-\frac{1}{2}\)加到第\(2\)行上,再将第\(1\)列乘以\(-\frac{1}{2}\)加到第\(2\)列上,得
\begin{equation*} A_1\rightarrow\begin{pmatrix} 2 & 1 & 2\\ 0 & -\frac{1}{2} & 0\\ 2 & 1 & 0 \end{pmatrix}\rightarrow\begin{pmatrix} 2 & 0 & 2\\ 0 & -\frac{1}{2} & 0\\ 2 & 0 & 0 \end{pmatrix}\triangleq A_2. \end{equation*}
\(A_2\)的第\(1\)行乘以\(-1\)加到第\(3\)行上,再将第\(1\)列乘以\(-1\)加到第\(3\)列上,得
\begin{equation*} A_2\rightarrow\begin{pmatrix} 2 & 0 & 2\\ 0 & -\frac{1}{2} & 0\\ 0 & 0 & -2 \end{pmatrix}\rightarrow\begin{pmatrix} 2 & 0 & 0\\ 0 & -\frac{1}{2} & 0\\ 0 & 0 & -2 \end{pmatrix}. \end{equation*}
总结例子里的规律,我们给出一般结论。

证明.

对矩阵\(A\)的阶数\(n\)作归纳法。
\(n=1\)时,结论显然成立。
假设对于\(n-1\)阶对称矩阵结论成立,以下考虑\(n\)阶对称矩阵\(A\)。不妨设\(A\neq 0\)
情形1:若 \(a_{11}\neq 0\),则可将第1行乘以\(-\frac{a_{j1}}{a_{11}}\)加到第\(j\)行上,再将第1列乘以\(-\frac{a_{j1}}{a_{11}}\)加到第\(j\)列上。由于\(a_{1j}=a_{j1}\),所以经过上述同步行列初等变换,\(A\)合同于
\begin{equation*} \begin{pmatrix} a_{11} & 0\\ 0 & A_1 \end{pmatrix}, \end{equation*}
即存在可逆矩阵\(P_1\),使得
\begin{equation*} P_1^TAP_1=\begin{pmatrix} a_{11} & 0\\ 0 & A_1 \end{pmatrix}. \end{equation*}
由于\(A^T=A\),所以
\begin{equation*} \left(P_1^TAP_1\right)^T=P_1^TA^TP_1=P_1^TAP_1, \end{equation*}
\(\begin{pmatrix} a_{11} & 0\\ 0 & A_1 \end{pmatrix}^T=\begin{pmatrix} a_{11} & 0\\ 0 & A_1 \end{pmatrix}\),则\(A_1^T=A_1\),由此可知\(A_1\)\(n-1\)阶对称矩阵。根据归纳假设,存在\(n-1\)阶可逆矩阵\(P_2\),使得\(P_2^TA_1P_2=D\)为对角矩阵。令 \(P=P_1\begin{pmatrix} 1 & 0\\ 0 & P_2 \end{pmatrix}\),则\(P\)\(n\)阶可逆矩阵,且
\begin{equation*} \begin{array}{ccl} P^TAP & = & \begin{pmatrix} 1 & 0\\ 0 & P_2 \end{pmatrix}^TP_1^TAP_1\begin{pmatrix} 1 & 0\\ 0 & P_2 \end{pmatrix}\\ & = & \begin{pmatrix} 1 & 0\\ 0 & P_2^T \end{pmatrix}\begin{pmatrix} a_{11} & 0\\ 0 & A_1 \end{pmatrix}\begin{pmatrix} 1 & 0\\ 0 & P_2 \end{pmatrix}\\ & = & \begin{pmatrix} a_{11} & 0\\ 0 & D \end{pmatrix} \end{array} \end{equation*}
是一个对角矩阵。
情形2:若\(a_{11}=0\),存在\(a_{jj}\neq 0\),则可对换第1行与第\(j\)行,再对换第1列与第\(j\)列,得到的矩阵的第1行第1列元素非零,转化为情形1。
情形3:若\(a_{jj}=0,j=1,\ldots ,n\)\(A\ne 0\),所以此时存在\(k\neq l\)使得\(a_{kl}\neq 0\),则可将\(A\)的第\(l\)行加到第\(k\)行,再将第\(l\)列加到第\(k\)列,所得矩阵的第\(k\)行第\(k\)列元素为\(2a_{kl}\),问题即可转化为情形1、2。
综上,存在可逆矩阵\(P\)使得\(P^TAP\)是对角矩阵。
用二次型语言来叙述上面的结论:秩为\(r\)\(n\)元二次型\(f (x_1,\dots,x_n)= X^TAX\),总可以经过可逆线性替换 \(X=CY\)化为
\begin{equation} f(x_1,\dots,x_n)=d_1 y_1^2+d_2y_2^2+\cdots+d_ry_r^2\tag{9.2.1} \end{equation}
称等式(9.2.1)右端二次型为标准二次型

子节 9.2.2 惯性定理与合同规范型

定理 9.2.5中把\(A\)经合同变换变成对角矩阵的\(P\)并不唯一,相应变成的对角矩阵也不唯一。由于合同是特殊的相抵,所以合同的矩阵具有相同的秩,即变成的对角矩阵有一样多的非0对角元。但秩相同并不能保证矩阵一定合同。为了更进一步讨论问题,我们先继续用合同变换化简矩阵。

证明.

对于实对称矩阵\(A\),根据定理 9.2.5,存在\(\mathbb{R}\)上可逆矩阵\(P_1\),使得
\begin{equation*} P_1^TAP_1=\begin{pmatrix} d_1 & & \\ & \ddots &\\ & & d_n \end{pmatrix}. \end{equation*}
因为\(r(A)=r\),不妨设
\begin{equation*} d_j>0,d_k< 0, d_l=0, \end{equation*}
其中\(j=1,\ldots ,p,k=p+1,\ldots,p+q(=r),l=r+1,\ldots ,n\)。令
\begin{equation*} P_2={\rm diag}\left(\sqrt{d_1^{-1}},\ldots,\sqrt{d_p^{-1}},\sqrt{-d_{p+1}^{-1}},\ldots,\sqrt{-d_{p+q}^{-1}},\ldots,1,\ldots,1\right). \end{equation*}
\(P=P_1P_2\),则\(P\)\(\mathbb{R}\)上可逆矩阵,且
\begin{equation*} P^TAP= \begin{pmatrix} E_p & & \\ & -E_q & \\ & & 0 \end{pmatrix}. \end{equation*}
接下来说明上面定理里的\(p\)是由\(A\)唯一确定的,进而\(q\)也是唯一确定的。

证明.

(9.2.2)(9.2.3)可知,经过非退化线性替换\(Z=Q^{-1}PY\),有
\begin{equation} \begin{array}{ll} & y_1^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_r^2\\ =& z_1^2+\cdots+z_q^2-z_{q+1}^2-\cdots-z_r^2. \end{array}\tag{9.2.4} \end{equation}
\(Q^{-1}P=\left(b_{jk}\right)\),则
\begin{equation*} \left\{\begin{array}{c} z_1=b_{11}y_1+\cdots+b_{1n}y_n,\\ z_2=b_{21}y_1+\cdots+b_{2n}y_n,\\ \vdots\\ z_n=b_{n1}y_1+\cdots+b_{nn}y_n. \end{array}\right. \end{equation*}
用反证法进行证明:假设\(p\ne q\),不妨进一步假设\(p >q \),考虑齐次线性方程组
\begin{equation} \left\{ \begin{array}{l} b_{11}y_1+\cdots+b_{1n}y_n=0,\\ \hspace{2.5cm} \vdots\\ b_{q1}y_1+\cdots+b_{qn}y_n=0,\\ y_{p+1}=0,\\ \hspace{1cm}\vdots\\ y_n=0 \end{array}\right.\tag{9.2.5} \end{equation}
这个齐次方程组有\(n\)个未知量,方程个数则有\(q+n-p < n\),所以必有非0解。设
\begin{equation*} Y=(c_1,\ldots ,c_n)^T \end{equation*}
(9.2.5)的一个非0解,则
\begin{equation*} c_{p+1}=\cdots=c_n=0, \end{equation*}
\(c_1,\ldots ,c_p\)不全为0。代入(9.2.4),左端的值\(c_1^2+\cdots+c_p^2\)大于0,而(9.2.5)的前\(q\)个方程确定了\(z_1=\cdots=z_q=0\),故(9.2.4)右端的值小于或等于0,这就产生了矛盾。于是\(p=q\)
定理 9.2.6中的\(p\)为矩阵\(A\)正惯性指数\(q\)负惯性指数\(s = p - q\)符号差。进一步,称矩阵\(\begin{pmatrix} E_p & & \\ & -E_q & \\ & & 0 \end{pmatrix}\)\(A\)合同规范型
定理 9.2.6证明过程可以看出,实对称矩阵\(A\)的合同标准形中,主对角元中正(负)数的个数即为\(A\)的正(负)惯性指数。注意到实对称矩阵都正交相似于对角元为其特征值的对角矩阵,所以我们有下面的推论。

9.2.10.

\(2\)阶实对称矩阵组成的集合按合同关系进行分类,并写出每一类的合同规范型。
解答.
根据推论 9.2.9,秩和正惯性指数完全确定了实对称矩阵的合同类。\(2\)阶实对称矩阵的秩有\(3\)种可能:\(0,1,2\)
  • 秩为\(0\)\(2\)阶实对称矩阵为\(\begin{pmatrix} 0 & 0\\ 0 & 0 \end{pmatrix}\)
  • 秩为\(1\)\(2\)阶实对称矩阵正惯性指数只有两种可能,分别是\(0\)\(1\),各组成一类,对应的合同规范型为:
    \begin{equation*} \begin{pmatrix} -1 & 0\\ 0 & 0 \end{pmatrix},\ \begin{pmatrix} 1 & 0\\ 0 & 0 \end{pmatrix}; \end{equation*}
  • 秩为\(2\)\(2\)阶实对称矩阵正惯性指数有\(3\)种:\(0,1,2\),各组成一类,对应的合同规范型为:
    \begin{equation*} \begin{pmatrix} -1 & 0\\ 0 & -1 \end{pmatrix},\ \begin{pmatrix} 1 & 0\\ 0 & -1 \end{pmatrix},\ \begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix}. \end{equation*}
由此看出,\(2\)阶实对称矩阵组成的集合共有\(6\)个合同类。

9.2.11.

给定3阶实矩阵\(A=\begin{pmatrix} -1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 2 \end{pmatrix}\),以下矩阵哪些合同于\(A\text{?}\)请说明理由。
\begin{equation*} B=\begin{pmatrix} -1 & 1 & 1\\ 0 & 1 & 1\\ 0 & 0 & 2 \end{pmatrix}, C=\begin{pmatrix} -1 & 0 & 0\\ 0 & 1 & \sqrt{2}\\ 0 & \sqrt{2} & 2 \end{pmatrix}, D=\begin{pmatrix} 0 & 2 & 0\\ 2 & 0 & 0\\ 0 & 0 & 2 \end{pmatrix}. \end{equation*}
解答.
因为\(A\)是实对称矩阵,与实对称矩阵合同的必为实对称矩阵,所以\(B\)不与\(A\)合同。
\(A\)的特征值为\(-1,1,2\)\(C\)的特征值为\(-1,0,3\)\(D\)的特征值为\(-2,2,2\),所以\(A,D\)的正惯性指数都是\(2\),负惯性指数都是\(1\),而\(C\)的正、负惯性指数都为\(1\),因此\(A\)\(D\)合同,但不与\(C\)合同。

练习 9.2.3 练习

基础题.

1.
用矩阵初等变换的方法求二次型
\begin{equation*} f(x_1,x_2,x_3)=x_1^2+x_2^2+x_3^2-2x_1x_2+2x_1x_3+6x_2x_3 \end{equation*}
的标准形,并写出所作的非退化线性替换。
2.
\(f(x_1,x_2,x_3)=x_1^2+x_2^2+x_3^2-2x_1x_2+2x_1x_3+6x_2x_3\),把它化为规范形,并写出所作的非退化线性替换。
3.
求实二次型
\begin{equation*} f(x_1,\ldots,x_{2n})=x_1x_2+x_3x_4+\cdots+x_{2n-1}x_{2n} \end{equation*}
的正、负惯性指数及符号差。
4.
\(f(x_1,x_2,\ldots,x_n)=X^TAX\)\(n\)元实二次型。若\(\mathbb{R}^n\)中存在列向量\(\alpha_1,\alpha_2\),使得\(\alpha_1^TA \alpha_1>0,\ \alpha_2^TA \alpha_2<0\),证明:存在\(0\neq \alpha_3\in\mathbb{R}^n\),使得\(\alpha_3^TA \alpha_3=0\)
5.
下列实二次型对应的矩阵中哪些是合同的?写出理由。
\begin{equation*} \begin{array}{c} f_1(x_1,x_2,x_3)=x_1^2+4x_2^2+x_3^2+4x_1x_2-2x_1x_3,\\ f_2(y_1,y_2,y_3)=y_1^2+2y_2^2-y_3^2+4y_1y_2-2y_1y_3-4y_2y_3,\\ f_3(z_1,z_2,z_3)=-4z_1^2-z_2^2-z_3^2-4z_1z_2+4z_1z_3+18z_2z_3. \end{array} \end{equation*}
6.
\(n\)阶实对称矩阵组成的集合按合同关系进行分类,共有几个合同类?

提高题.

7.
\(A\)\(n\)阶实对称矩阵,且\(A\)可逆,证明:在\(\mathbb{R}\)上,
  1. \(A\)合同于\(A^{-1}\)
  2. \(\det A>0\)时,\(A\)合同于\({\rm adj}A\)
8.
确定二次型\(f(x_1,x_2,x_3)=ax_1x_2+bx_1x_3+cx_2x_3\)的秩和符号差。
9.
证明:一个\(n\)元实二次型可以分解成两个实系数的一次齐次多项式之积的充分必要条件是:它的秩等于1,或者它的秩等于2且符号差为0。
10.
\(f(x_1,\ldots,x_n)\)是秩为\(n\)的实二次型,证明:若\(f(x_1,\ldots,x_n)\)的符号差为\(s\),则存在\(\mathbb{R}^n\)的一个\(\frac{1}{2}(n-|s|)\)维子空间\(V\),使得对任意\((a_1,\ldots,a_n)^T\in V\),都有\(f(a_1,\ldots,a_n)=0\)

挑战题.

11.
设实二次型
\begin{equation*} f(x_1,\ldots,x_n)=z_1^2+\cdots+z_k^2-z_{k+1}^2-\cdots-z_{k+s}^2, \end{equation*}
其中\(z_i=\sum_{j=1}^{n}a_{ij}x_j(1\le i\le k+s) \)。 证明\(f\) 的正惯性指数\(p\le k\),负惯性指数\(q\le s\)
12.
\(p_M\)为实对称矩阵\(M\)的正惯性指数,证明:对任意\(n\)阶实对称矩阵\(A,B\)
\begin{equation*} p_{A+B}\leq p_A+p_B. \end{equation*}
13.
\(A\)\(n\)阶实可逆矩阵,求
\begin{equation*} B=\begin{pmatrix} 0&A\\A^T&0 \end{pmatrix} \end{equation*}
的正负惯性指数。
14. 第十届大学生数学竞赛初赛.
\(A=(a_{ij})\)\(n\)阶实方阵,满足
  1. \(a_{11}=a_{22}=\cdots=a_{nn}=a >0\)
  2. 对每个\(i(i=1,\ldots ,n)\),有 \(\sum\limits_{j=1}^n |a_{ij}|+\sum\limits_{j=1}^n|a_{ji}|< 4a\)
求二次型\(f(X)=X^TAX\)的规范形。