主要内容

高等代数: 多项式与线性代数

9.1 二次型与矩阵合同

本章中,我们将以实数域\(\R\)上二次型为主体来展开相应的知识体系。

子节 9.1.1 实二次型的定义与矩阵表示

实系数的\(n\)元二次齐次多项式可以一般的表示为
\begin{equation} \begin{array}{rcl} f(x_1,\cdots,x_n) & = & a_{11}x_1^2+2a_{12}x_1x_2+\cdots+2a_{1n}x_1x_n\\ & &\phantom{a_{11}x_1^2} +\phantom{2} a_{22}x_2^2 \phantom{x_1}+\cdots+2a_{2n}x_2x_n\\ & &\phantom{a_{11}x_1^2+2a_{22}x_2x_1} +\cdots+\phantom{2} a_{nn}x^2_n, \end{array}\tag{9.1.1} \end{equation}
其中每一个非平方项的系数记为\(2a_{ij}\ (i < j) \)是为了下面讨论方便。我们马上就可以看到这样记的原因。
下面我们引入矩阵工具改写二次齐次多项式。令 \(a_{ji}=a_{ij}\ (1\le i < j\le n) \),则
\begin{equation*} 2a_{ij}x_ix_j = a_{ij}x_ix_j+ a_{ji}x_jx_i, \end{equation*}
于是 (9.1.1)可以改写为
\begin{equation*} f(x_1,\cdots,x_n) = \sum_{i=1}^n\sum_{j=1}^n a_{ij}x_ix_j. \end{equation*}
\begin{equation*} A = \begin{pmatrix} a_{11} &\cdots & a_{1n}\\ \vdots & \ddots & \vdots\\ a_{n1} & \cdots & a_{nn} \end{pmatrix},\quad X = \begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix}, \end{equation*}
容易验证二次齐次多项式可以用下面的矩阵形式表示:
\begin{equation*} f(x_1,\cdots,x_n) = f(X) = X^TAX. \end{equation*}
我们引入如下定义。

定义 9.1.1.

\(A =(a_{ij})_{n\times n} \)是一个\(n\)阶实对称矩阵,\(X=(x_1,\cdots,x_n)^T \in \R^n\),称二次齐次多项式
\begin{equation*} f(X) = X^TAX \end{equation*}
为一个实二次型,实对称矩阵\(A\)称为实二次型\(f\)的矩阵。
矩阵\(A\)的秩也称为二次型\(f\)的秩,记作\(r(f)\)

9.1.2.

给出二次齐次多项式,求矩阵,包含对角型二次型
解答.
需要说明的是当\(A\)不是对称矩阵时,\(X^TAX\)仍然是一个二次齐次多项式,此时我们会选择对称矩阵\((A+A^T)/2\)作为这个二次型的矩阵。这样选择的好处在后续二次型的化简过程中会体现出来。

9.1.3.

证明对于任意的方阵\(A\)
\begin{equation*} X^TAX = X^T(\frac{A+A^T}{2})X. \end{equation*}
解答.
称二次型中的\(a_{ij}x_ix_j\ ( i\ne j, a_{ij}\ne 0)\)为一个交叉项 。容易看到,当二次型中只有平方项而没有交叉项时,二次型作为函数其函数值随自变量的变化规律是较为明显的;也就是说当二次型的矩阵是对角矩阵时,二次型是较简单的。下一小结中,我们来研究如何把二次型化简。

子节 9.1.2 二次型的化简与矩阵合同

\(n\)元二次型可以看成是\(\R^n\)\(\R\)的映射,此时\(X\)可以看作\(\R^n\)中向量在标准基下的坐标。在研究线性变换时,通过替换空间的基,线性变换的表示矩阵可以得到化简。类似的思想也可以用来化简二次型。注意到换基前后,同一个向量的不同坐标之间差一个可逆矩阵,因此我们引入如下定义。

定义 9.1.4.

\(X =(x_1,\cdots,x_n)^T \)\(Y= (y_1,\cdots, y_n)^T\)\(P\)是一个\(n\)阶实方阵。若\(X=PY \),则把二次型中的\(X\)替换为\(PY\)的过程称为由变量\(x_1,\cdots,x_n\)到变量\(y_1,\cdots,y_n\)线性替换
\(P\)可逆矩阵时,线性替换称为可逆线性替换非退化线性替换
\(P\)正交矩阵时,线性替换称为正交线性替换
在接下来的讨论中,如果未加说明,我们默认的线性替换都是可逆线性替换。
进行可逆线性替换前后的两个二次型可以看成是同一个线性空间\(V\)\(\R\)的映射在两组不同基下的两个不同表达式。这两个不同表达式中的矩阵有如下关系。

证明.

于是,我们可以引入矩阵的另一种重要等价关系。

定义 9.1.6.

\(A,B\in \mathbb{R}^{n\times n}\)。如果存在\(n\)阶可逆矩阵\(P\),使得
\begin{equation*} B=P^TAP, \end{equation*}
则称矩阵\(B\)\(A\)合同
关于合同关系我们还有如下几点说明:
  • 与对称矩阵合同的矩阵是对称矩阵:若\(A\)\(B\)合同且\(A^T= A\),则存在可逆矩阵\(P\)使得\(B=P^TAP\),于是
    \begin{equation*} B^T=(P^TAP)^T=P^TA^TP=P^TAP =B, \end{equation*}
    \(B\)也是对称矩阵。
  • 合同是特殊的相抵:相抵关系中\(B=PAQ\),左右两个可逆矩阵\(P\)\(Q\)可以独立变化;而合同关系中要求\(B=P^TAP\),即左右两个可逆矩阵要求互为转置,要求比相抵关系更严格。
  • 正交相似关系既是相似也是合同: 若\(A\)\(B\)正交相似,则存在正交矩阵\(Q\)使得\(Q^{-1}AQ= B\)。注意到正交矩阵\(Q\)满足\(Q^{-1}=Q^T\),所以前式也等价于\(Q^TAQ= B\),即\(A\)\(B\)也合同。
注意到每一个实对称矩阵都可以正交相似于实对角矩阵,因此我们可以用正交相似来化简实二次型。

9.1.7.

利用正交线性替换化简二次型
\begin{equation*} f(x_1,x_2)= 5x_1^2-4x_1 x_2+5x_2^2. \end{equation*}
解答.
下面我们给出一般的理论。

子节 9.1.3 二次型及其正交化简的几何解释

我们以例 9.1.7中的二次型来给出几何解释。首先利用截痕法来建立这个二次型对应的函数图像。所谓截痕法,是先用一组平行平面去交(截)函数曲面,确定函数曲面与每一个平面交线(截痕)的形状,然后再把这些交线拼起来,进而获得对函数曲面整体理解的一种方法。现在用平行于xoy平面的平面\(z=c\)来截函数曲面,可以获得此二次型函数的等值线
\begin{equation*} 3x_1^2-4x_1 x_2+3x_2^2 = c, \end{equation*}
不妨以\(c=12\)为例。
将此二次型正交化简时使用的正交矩阵\(P\)
\begin{equation*} P= \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}}\\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}. \end{equation*}
\(P\)做列分块,记所得的两个列向量为\(u_1\)\(u_2\),即
\begin{equation*} u_1 =(\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}})^T, \end{equation*}
\begin{equation*} u_2 =(-\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}})^T. \end{equation*}
下面的sage代码片段将等值线、\(u_1\)\(u_2\)画在一起。
观察上图可知,等值线\(3x_1^2-4x_1 x_2+3x_2^2 =12\)是一个椭圆,\(u_1\)\(u_2\)所在直线则恰好是椭圆的对称轴。当我们选择\(u_1\)\(u_2\)作为基时,此椭圆的方程恰好变成标准椭圆方程\(y_1^2+5y_2^2=12\)
注意到正交变换是一个欧式空间同构,在\(\R^3\)中,变换前后两个二次型对应的函数曲面形状是一样的,变换前的函数曲面可以经过旋转或镜面反射变成变换后的函数曲面。
具体到上面的例子,上述的正交变换是一个xoy平面上的旋转,旋转角度为45度,因此变换后的二次型对应的函数曲面可以看成是将原函数曲面绕z轴旋转45度后获得的曲面。具体可参考下面的交互式图形。

子节 9.1.4 复二次型/Hermit二次型*

在实际应用中,复线性空间上的二次型是按如下方式定义的。

定义 9.1.9.

\(A\in \C^{n\times n}\)是一个Hermit矩阵,\(X=(x_1,\dots,x_n)^T\in \C^n\),称
\begin{equation*} f(X) = X^HAX \end{equation*}
为一个 复二次型Hermit二次型。矩阵\(A\)称为复二次型\(f\)的矩阵。
这样定义有如下的好处。
复二次型在复线性空间上的性质与实二次型在实线性空间上的性质类似。在复线性空间上,我们也可以进行正交化简,只不过此时的正交化简是指酉相似化简。

9.1.11.

利用酉相似化简复二次型
\begin{equation*} f(x_1,x_2)= . \end{equation*}

练习 9.1.5 练习

基础题.

1.
\(f(x_1,x_2,x_3)=\begin{pmatrix} x_1&x_2&x_3 \end{pmatrix} \begin{pmatrix} 2&-1&3\\ 1&-1&7\\ -1&1&3 \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}\),求该二次型的矩阵。
2.
\(f(x_1,x_2,x_3)=x_1^2+4x_2^2+4x_3^2-4x_1x_2+2ax_1x_3+2bx_2x_3\)的秩为\(1\),求\(a,b\)的值。
3.
设实二次型\(f(x_1,x_2,\cdots ,x_n)=\sum\limits_{i=1}^n (a_{i1}x_1+a_{i2}x_2+\cdots a_{in}x_n)^2\),证明:\(f\)的秩等于矩阵\(A\)的秩,其中\(A=\begin{pmatrix} a_{ij} \end{pmatrix}_{n\times n}\)
4.
求二次型\(f(x_1,x_2,x_3)=(ax_1+bx_2+cx_3)^2\)的矩阵和秩。

提高题.

5.
\(V\)\(n\)维欧氏空间,\(\alpha_1,\dots ,\alpha_n\)\(V\)的一个基,\(A=\left((\alpha_i,\alpha_j)\right)_{n\times n}\)称为基\(\alpha_1,\dots ,\alpha_n\)度量矩阵。证明:同一个\(n\)维欧氏空间\(V\)在不同基下的度量矩阵合同。

挑战题.

6.