主要内容

高等代数: 多项式与线性代数

7.8 初等因子组与Jordan标准型

定理 7.3.20表明在复数域上每一个方阵都相似于上三角矩阵,对角元为矩阵的所有特征值。本节中将进一步细化这个结论,给出一个矩阵在相似变换下能变成的“最简”形式,这种最简形式就是Jordan标准型。在讨论这个问题时,\(\lambda\)-矩阵是一个中间工具。
本节中需要使用复数域上多项式均可分解为一次因式的乘积这一重要性质,因此本节中的数域为复数域\(\C\)

子节 7.8.1 初等因子组

设复数域\(\C\)\(n\)阶方阵\(A\)的不变因子组为:
\begin{equation*} \left( 1,\dots,1,d_1(\lambda),\dots,d_k(\lambda) \right), \end{equation*}
其中有\(n-k\)个1。对所有的非平凡不变因子\(d_j(\lambda)(j=1,\dots,k) \)在复数域上进行因式分解,记所获得的分解式为:
\begin{gather} \begin{array}{c} d_1(\lambda)=(\lambda-\lambda_1)^{e_{11}} \cdots (\lambda-\lambda_t)^{e_{1t}}, \\ d_2(\lambda)=(\lambda-\lambda_1)^{e_{21}} \cdots (\lambda-\lambda_t)^{e_{2t}}, \\ \vdots \\ d_k(\lambda)=(\lambda-\lambda_1)^{e_{k1}} \cdots (\lambda-\lambda_t)^{e_{kt}},\end{array} \tag{7.8.1} \end{gather}
其中\(\lambda_1,\dots,\lambda_t\)\(A\)的所有互异特征值(这里为了有统一的书写方式,允许部分\(e_{js}=0\))。由于有\(d_{j}(\lambda)|d_{j+1}(\lambda)\)的限制,所以分解式中的\(e_{js}\)满足
\begin{equation} 0\le e_{1s}\le \cdots \le e_{ks},\ s=1,\dots,t.\tag{7.8.2} \end{equation}

7.8.1.

设矩阵\(A\)的不变因子为:
\begin{equation*} 1,\dots,1,(\lambda-1)(\lambda^{2}+1),(\lambda-1)^{2}(\lambda^{2}+1)(\lambda^{2}-2), \end{equation*}
将其分解为(7.8.1)的形式。
解答.
\begin{equation*} d_1(\lambda)=(\lambda-1)(\lambda-i)(\lambda+i)(\lambda-\sqrt{2})^0(\lambda+\sqrt{2})^0, \end{equation*}
\begin{equation*} d_2(\lambda)=(\lambda-1)^2(\lambda-i)(\lambda+i)(\lambda-\sqrt{2})(\lambda+\sqrt{2}). \end{equation*}

定义 7.8.2.

复方阵\(A\)所有非平凡不变因子在分解式(7.8.1)中满足\(e_{js}>0\)\((\lambda -\lambda_s)^{e_{js}}\)称为\(A\)的一个初等因子\(A\)的全体初等因子(相同的按出现次数计算)构成的多重集称为\(A\)初等因子组

7.8.3.

试写出例 7.8.1中的 \(A\)的初等因子组。
解答.
\(A\)的初等因子组为:
\begin{equation*} \lambda-1,(\lambda-1)^2,\lambda-i,\lambda-i,,\lambda+i,\lambda+i,\lambda-\sqrt{2},\lambda+\sqrt{2}. \end{equation*}
从定义可知,初等因子组由不变因子组决定。由于有 (7.8.2) 的限制,若给定了初等因子组,则其不变因子组也是确定的,即不变因子组也可以由初等因子组决定。 所以有下面的结论。

证明.

借助(7.8.2) 中的记号, 因为有\(0\leq e_{1j}\leq e_{2j}\leq\cdots\leq e_{rj},\ j=1,\dots , t\), 即同一个因式方幂对应的初等因子中,方次最高的必出现在最后一个不变因子\(d_{k}(\lambda)\)的分解式中,次高的必出现在倒数第二个不变因子\(d_{k-1}(\lambda)\)中,依此类推,可以确定所有的不变因子。
我们通过下面一个具体的例子来说明上述命题。

7.8.5.

设数字矩阵\(A\)\(\C\)上的初等因子组为
\begin{equation*} (\lambda-1)^{2},(\lambda-1)^{2},(\lambda-1)^{2},\lambda+1,\lambda+1,(\lambda-i)^{2},(\lambda+i)^{2}. \end{equation*}
\(A\)是几阶矩阵?求\(A\)的不变因子组。
解答.
\(A\)所有初等因子的乘积是\(A\)的特征多项式,次数为\(12\),因此\(A\)\(12\)阶矩阵。\(A\)的不变因子组为:
\begin{equation*} g_1(\lambda)=1, \end{equation*}
\begin{equation*} \vdots \end{equation*}
\begin{equation*} g_9(\lambda)=1, \end{equation*}
\begin{equation*} g_{10}(\lambda)=(\lambda-1)^{2}, \end{equation*}
\begin{equation*} g_{11}(\lambda)=(\lambda-1)^{2}(\lambda+1), \end{equation*}
\begin{equation*} g_{12}(\lambda)=(\lambda-1)^{2}(\lambda+))(\lambda-i)^{2}(\lambda+i)^{2}. \end{equation*}
根据上面的讨论,可知下面的结论成立。
若按定义求初等因子组,则需要先求不变因子组。事实上,初等因子组有更简单的求法,特别是针对分块对角矩阵。先来看下面的引理。

证明.

\begin{equation*} \left(f_1(\lambda),f_2(\lambda)\right)=d_1(\lambda),\left(g_1(\lambda),g_2(\lambda)\right)=d_2(\lambda), \end{equation*}
则存在多项式\(h_1(\lambda),h_2(\lambda),k_1(\lambda),k_2(\lambda)\),使得
\begin{equation*} f_1(\lambda)=d_1(\lambda)h_1(\lambda),f_2(\lambda)=d_1(\lambda)h_2(\lambda), \end{equation*}
\begin{equation*} g_1(\lambda)=d_2(\lambda)k_1(\lambda),g_2(\lambda)=d_2(\lambda)k_2(\lambda), \end{equation*}
其中\(\left(h_1(\lambda),h_2(\lambda)\right)=1,\left(k_1(\lambda),k_2(\lambda)\right)=1\)。由条件\(\left(f_i(\lambda),g_j(\lambda)\right)=1,\ (i,j=1,2)\)\(\left(h_i(\lambda),k_j(\lambda)\right)=1,(i,j=1,2)\), 则\(\left(h_1(\lambda)k_1(\lambda),h_2(\lambda)k_2(\lambda)\right)=1\)。因此
\begin{equation*} \begin{array}{cl} &\left(f_1(\lambda)g_1(\lambda),f_2(\lambda)g_2(\lambda)\right)\\ =&\left(d_1(\lambda)h_1(\lambda)d_2(\lambda)k_1(\lambda),d_1(\lambda)h_2(\lambda)d_2(\lambda)k_2(\lambda)\right)\\ =&d_1(\lambda)d_2(\lambda)\left(h_1(\lambda)k_1(\lambda),h_2(\lambda)k_2(\lambda)\right)\\ =&d_1(x)d_2(x),\end{array} \end{equation*}
结论成立。

证明.

设左边矩阵为\(A(\lambda)\),右边矩阵为\(B(\lambda)\),根据 引理 7.8.7\(A(\lambda),B(\lambda)\)的1阶行列式因子都是\((\lambda-\lambda_1)^{l_2}\left(g_1(\lambda),g_2(\lambda)\right)\),而它们的2阶行列式因子都是\((\lambda-\lambda_1)^{l_1+l_2}g_1(\lambda)g_2(\lambda)\),因此\(A(\lambda)\simeq B(\lambda)\)
\begin{equation*} \end{equation*}

证明.

反复使用引理 7.8.8可得\(\lambda E-A\)的法式,因此\(A\)的初等因子组为上述形式。
应用定理 7.8.9,初等因子组的计算可以得到简化,如下例所示。

7.8.10.

\(A=\begin{pmatrix} 1&0&0&0&0\\ 1&1&0&0&0\\ 0&0&1&0&0\\ 0&0&0&2&0\\ 0&0&0&0&3 \end{pmatrix}\),求\(A\)的初等因子组、不变因子组。
解答.
\(B=\begin{pmatrix} 1&0\\ 0&1 \end{pmatrix}\),则
\begin{equation*} \lambda E_5-A=\begin{pmatrix} \lambda E_2-B&0&0&0\\ 0&\lambda-1&0&0\\ 0&0&\lambda-2&0\\ 0&0&0&\lambda-3 \end{pmatrix}. \end{equation*}
因为\(\lambda E_2-B\)的不变因子为\(1,(\lambda-1)^2\),所以
\begin{equation*} \lambda E_5-A\simeq \begin{pmatrix} 1&0&0&0&0\\ 0&(\lambda-1)^2&0&0&0\\ 0&0&\lambda-1&0&0\\ 0&0&0&\lambda-2&0\\ 0&0&0&0&\lambda-3 \end{pmatrix}. \end{equation*}
根据定理定理 7.7.21定理 7.8.9\(A\)的初等因子组为
\begin{equation*} (\lambda-1)^2,\lambda-1,\lambda-2,\lambda-3. \end{equation*}
从而\(A\)的不变因子组为
\begin{equation*} 1,1,1,\lambda-1,(\lambda-1)^2(\lambda-2)(\lambda-3). \end{equation*}

子节 7.8.2 Jordan标准型

接下来介绍矩阵的Jordan标准型。理解Jordan标准型对理解线性变换和方阵的性质至关重要。一定程度上,Jordan标准型相关结论的提出标志着线性变换理论框架的成熟。
先来看Jordan块的定义,它是若当标准型矩阵的主要组成结构。

定义 7.8.11.

\(k\)阶矩阵
\begin{equation*} J(\lambda_0,k) = \begin{pmatrix} \lambda_0 & & &\\ 1 & \lambda_0 & &\\ &\ddots & \ddots & \\ & & 1 & \lambda_0 \end{pmatrix}_{k\times k}, \end{equation*}
\(\lambda_0\)\(k\)Jordan块

备注 7.8.12.

Jordan块也可以被定义为上三角矩阵,即
\begin{equation*} J'(\lambda_0,k) = \begin{pmatrix} \lambda_0 &1 & &\\ & \lambda_0 &\ddots &\\ & & \ddots & 1\\ & & & \lambda_0 \end{pmatrix}_{k\times k} \end{equation*}
二者没有本质差别。
Jordan块和初等因子之间有着密切联系,一个Jordan块可以对应一个初等因子。

证明.

简记\(J(\lambda_0,k)= J\)。在\(J\)的特征矩阵\(\lambda E_k -J\)中,删除第1行和最后1列然后取行列式,可得\(\lambda E_k -J\)一个\(k-1\)阶子式
\begin{equation*} \begin{vmatrix} -1&\lambda-\lambda_0 &0 &\cdots&0&\\ 0&-1& \ddots &\ddots&\vdots&\\ \vdots&\ddots&\ddots&\ddots& 0 \\ 0&\cdots& 0 &-1&\lambda-\lambda_0\\ 0&\cdots& 0 &0&-1\\ \end{vmatrix}=(-1)^{k-1}, \end{equation*}
由于\(J\)\(k-1\)阶行列式因子式\(D_{k-1}(\lambda)\)是其特征矩阵所有\(k-1\)阶子式的最大公因式,所以\(D_{k-1}(\lambda)=1\)。又根据命题 7.7.13,对\(i=1,\dots, k-2\)\(D_{i}(\lambda)|D_{k-1}(\lambda)\),所以\(D_{i}(\lambda)=1\)
最后,\(D_k(\lambda)=\det(\lambda E_k -J) = (\lambda-\lambda_0)^k\),所以 \(J\)的行列式因子组为\(\left(1,\dots ,1,(\lambda-\lambda_0)^k\right)\),其中有\(k-1\)\(1\)。相应地,其初等因子组中只有一个初等因子\((\lambda-\lambda_0)^k\)

证明.

注意到两个数字矩阵相似的一个充要条件条件是它们有相同的初等因子组。结合上面的引理,可知下面的定理结论成立。
定理 7.8.15中的分块对角阵\(J\)称为矩阵\(A\)Jordan标准型
注意到初等因子组是一个(多重)集合,集合中的元素之间是没有顺序的;对应的,Jordan标准型矩阵中Jordan块的排列也是任意的。由于每一个初等因子唯一对应一个Jordan块,而给定矩阵的初等因子组是唯一确定的,故在不考虑对角块排列次序的意义下,矩阵的Jordan标准型是唯一确定的。
对于一个给定的线性变换\(\varphi\),其表示矩阵越简单则越容易理解其作用规律。我们有如下结论。

子节 7.8.3 Jordan标准型的性质与简单应用

Jordan标准型理论是矩阵基础理论中的制高点,有了Jordan标准型后,很多初始复杂的关系都可以梳理清楚。本节中我们来举例说明Jordan标准型的用途。

证明.

  1. 根据初等因子组的定义,所有初等因子的乘积就是所有不变因子的乘积,也就等于特征多项式。结论的后半段可直接验证。
  2. 对一个Jordan块矩阵\(J = J(\lambda_0,k)\),其特征多项式(也是初等因子)为\((\lambda-\lambda_0)^k\),根据 定理 7.5.9,其极小多项式必然为\((\lambda-\lambda_0)^t\)的形式,其中\(t\le k\) 。可以直接验证\((J -\lambda_0E)^{k-1}\ne 0\)\((J -\lambda_0E)^{k}= 0\),于是\(m_J(\lambda)=(\lambda-\lambda_0)^k\),和其初等因子一样。
    \(A\)的Jordan标准型为\(B\),则\(B\)是一个以Jordan块为对角块的分块对角阵。多次使用 定理 7.5.14可知\(m_B(\lambda)\)是其所有Jordan块的初等因子的最小公倍式,而这个最小公倍式就是初等因子组中含不同的\(\lambda-\lambda_i\)方幂中次幂最高项之积。注意到\(m_B(\lambda)=m_A(\lambda)\),所以结论成立。
下述推论可以帮助我们更好地理解Jordan标准型与矩阵性质的连接,其证明留给读者作为练习。
接下来看一下Jordan标准型与矩阵秩的联系。设\(A\in\mathbb{C}^{n\times n}\),且\(A\)的初等因子组为\((\lambda-\lambda_1)^{e_1},(\lambda-\lambda_2)^{e_2},\cdots ,\) \((\lambda-\lambda_k)^{e_k},\)\(A\)相似于分块对角矩阵
\begin{equation*} J=\begin{pmatrix} J(\lambda_1,e_1)&&&\\ &J(\lambda_2,e_2)&&\\ &&\ddots&\\ &&&J(\lambda_k,e_k) \end{pmatrix}. \end{equation*}
于是,\(r(A)=r\left(J(\lambda_1,e_1)\right)+r\left(J(\lambda_2,e_2)\right)+\cdots +r\left(J(\lambda_k,e_k)\right)\)。而
\begin{equation*} r\left(J(\lambda,e)\right)=\left\{\begin{array}{cl} e,&\mbox{当}\lambda\neq 0\mbox{时,}\\ e-1,&\mbox{当}\lambda= 0\mbox{时。}\\ \end{array}\right. \end{equation*}
于是可知下面的两个结论成立。
本节的最后,我们来介绍Jordan标准型的一个最重要应用:计算矩阵多项式。无论在理论分析还是实际应用中,将方阵带入一个给定多项式都是常见操作。当矩阵阶数很大,或多项式次数较高时,由于矩阵乘法的运算会消耗大量时间,因此按照表达式将矩阵直接带入计算是几乎不可能完成的事(耗时太久)。
\(A\)是一个复方阵,\(f(x)\)是一个多项式。我们有一个常用的重要事实:若\(A = PJP^{-1}\),则
\begin{equation*} f(A) = Pf(J)P^{-1}. \end{equation*}
于是\(f(A)\)的计算可以转化为\(f(J)\)\(P\)矩阵的计算。注意到Jordan标准型矩阵是一个分块对角阵,所以只需要知道每一个对角块(即一个Jordan块)带入到\(f(x)\)的运算结果即可。下面的结论就是将Jordan块带入多项式的结果公式。

证明.

\(f(x)\)\(\lambda_0\)处展开为Taylor级数(见数学分析教材):
\begin{equation*} f(x)=\sum_{i=0}^{n}\frac{f^{(i)}(\lambda_0)}{i!}(x-\lambda_0)^i, \end{equation*}
其中\(n\)是多项式的次数。
\(J_0 = J(0,k)\),则
\begin{equation*} J_0 = J -\lambda_0E_k = \begin{pmatrix} 0 & & & \\ 1 & 0 & & \\ &\ddots & \ddots & \\ & & 1 & 0 \end{pmatrix}. \end{equation*}
\(J\) 代入\(f(x)\)中,可得
\begin{equation*} f(J) = f(\lambda_0)E + \frac{f'(\lambda_0)}{1!}J_0+\frac{f^{''}(\lambda_0)}{2!}J_0^2+ \cdots + \frac{f^{(i)}(\lambda_0)}{i!}J_0^i +\cdots \end{equation*}
利用\(J_0\)矩阵的乘法性质,可知结论成立。
从这个公式可知,只需知道\(A\)的Jordan标准型,我们就可以对\(f(A)\)这个矩阵有一个宏观的掌握。

子节 7.8.4 过渡矩阵的计算*

本节介绍两种计算Jordan标准型过渡矩阵\(P\)的计算方法。
第一种方法为将\(P\)列分块,按列解方程\(AP=PJ\)。来看一个具体的例子。

7.8.24. 按列解过渡矩阵.

\begin{equation*} A= \begin{pmatrix} 4 & -1 & 2\\ -9 & 4 & -6\\ -9 & 3 & -5 \end{pmatrix} \end{equation*}
求过渡矩阵\(P\)使得\(P^{-1}AP=J\),其中\(J\)\(A\)的Jordan标准型。
解答.
计算特征矩阵\(\lambda E -A\)的Smith标准型可知\(A\)的初等因子组中有两个初等因子,分别是\((\lambda-1)^2\)\(\lambda-1\)。于是可取
\begin{equation*} J = \begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 1 & 1 \end{pmatrix}. \end{equation*}
\(P\)矩阵做列分块,\(P = \begin{pmatrix} P_1 & P_2 & P_3 \end{pmatrix}\)。将\(P_1,P_2,P_3\)分别代入方程\(AP=PJ\)中,得到如下方程组:
\begin{equation} AP_1= P_1,\quad AP_2=P_1+P_2,\quad AP_3=P_3.\tag{7.8.3} \end{equation}
下面先求解\(P_2\)。要满足 (7.8.3)\(P_2\)只需满足(请思考为什么):
\begin{equation*} (A-E)P_2\ne 0,\quad (A-E)^2P_2=0. \end{equation*}
注意到\((A-E)^2=0\),只需要取\(P_2=\begin{pmatrix} 1\\ 0\\ 0 \end{pmatrix}\)即可。
\(P_1=(A-E)P_2 =\begin{pmatrix} 3\\ -9\\ -9 \end{pmatrix}\)
\(P_1,P_3\)都是1的特征向量,要想保证\(P\)可逆,需要保证\(P_1,P_3\)线性无关。取\(P_3=\begin{pmatrix} 0\\ 0\\ 1 \end{pmatrix}\),则\(P=\begin{pmatrix} 3 & 1 & 0\\ -9 & 0 & 0\\ -9 & 0 & 1 \end{pmatrix}\)
另一种典型的求过渡矩阵的方法是利用定理 7.6.10中的证明过程,利用\(\lambda\)-矩阵相抵和带余除法求出过渡矩阵。
我们来简要介绍一下这个方法。设\(A\)是方阵,\(J\)是它的Jordan标准型,则\(\lambda E-A\)经过\(\lambda\)-矩阵初等变换变成\(\lambda E-J\),即存在可逆矩阵\(M(\lambda),N(\lambda)\),使得\(M(\lambda)(\lambda E-A)N(\lambda)=\lambda E-J\)。参考定理 7.6.10的证明过程,取\(L\)\(M(\lambda)\)左除\(\lambda E -J\)的余式,则\(LA=BL\),即\(L^{-1}\)就是我们要求的过渡矩阵。看一个具体的例子。

7.8.25. 利用\(\lambda\)-矩阵求\(P\).

\begin{equation*} A= \begin{pmatrix} 4 & -1 & 2\\ -9 & 4 & -6\\ -9 & 3 & -5 \end{pmatrix} \end{equation*}
求过渡矩阵\(P\)使得\(P^{-1}AP=J\),其中\(J\)\(A\)的Jordan标准型。
解答.

练习 7.8.5 练习

基础题.

1.
已知\(6\)\(\lambda\)-矩阵\(A(\lambda)\)的秩为\(4\),初等因子组为
\begin{equation*} \lambda ,\lambda,\lambda^3,\lambda+1,(\lambda+1)^3,\lambda-2,(\lambda-2)^2, \end{equation*}
\(A(\lambda)\)的行列式因子和不变因子。
2.
已知矩阵\(A\)\(\mathbb{R}\)上的初等因子组为\(\lambda,\lambda^3,(\lambda-\sqrt{2})^2,(\lambda +\sqrt{2})^2,(\lambda^2+1)^3,\)\(A\)的行列式因子和不变因子。
3.
求下列矩阵的初等因子组。
(1)\(\begin{pmatrix} \lambda&1&0\\0&\lambda&1\\0&0&\lambda \end{pmatrix}\);(2)\(\begin{pmatrix} \lambda^2-\lambda&0&0\\0&\lambda-1&0\\0&0&\lambda^3 \end{pmatrix}\)
4.
\(A\)的初等因子组为\(\lambda^2,\lambda+1,(\lambda+1)^3\),求\(A\)的Jordan标准形。

提高题.

5.
\(\mathbb{C}\)上三阶方阵\(A=\begin{pmatrix} 2&0&0\\a&2&0\\b&c&1 \end{pmatrix}\)
  1. 求出\(A\)所有可能的Jordan标准形;
  2. 给出\(A\)可对角化的充分必要条件。
6.
\(A\)\(3\)阶幂零矩阵,即存在\(k\in\mathbb{Z}^+\)使得\(A^k=0\),试求\(A\)的所有可能的Jordan标准形。
7.
\(A\)\(3\)阶幂等矩阵,即\(A^2=A\),试求\(A\)的所有可能的Jordan标准形。
8.
\(A\)\(n\)阶幂等矩阵,且秩等于\(r\),试求\(A\)的Jordan标准形。
9.
\(A\)\(3\)阶方阵,满足\(A^2=E\),试求\(A\)的所有可能的Jordan标准形。
10.
\(A\)\(3\)阶复方阵,试求\(A\)的所有可能的Jordan标准形。
11.
  1. \(a\)是数域\(\mathbb{F}\)中的非零数,求\(J(a,n)^2\)的Jordan标准形;
  2. \(A\)\(n\)阶可逆复方阵,证明:存在\(n\)阶复矩阵\(B\),使得\(A=B^2\)
12.
\(A\)\(10\)阶方阵,满足\(A^2(A-2E)^2(A-E)=0\),且\(r(A)=6\)\(r(A-2E)=9\)\(r(A-E)=8\),求\(A\)的Jordan标准形。
13.
\(n\)阶复方阵\(A\)不可逆且不是幂零矩阵,证明:\(A\)相似于矩阵
\begin{equation*} \begin{pmatrix} B&0\\ 0&C \end{pmatrix}, \end{equation*}
其中\(B\)是幂零矩阵,\(C\)是可逆矩阵。
14.
\(A\)\(\mathbb{C}\)上非零且不可逆的\(n\)阶复方阵,若\(r(A)=r(A^2)\),证明:\(A\)相似于矩阵
\begin{equation*} \begin{pmatrix} 0&0\\ 0&C \end{pmatrix}, \end{equation*}
其中\(C\)\(r(A)\)阶可逆矩阵。

挑战题.

15.
\(A=\begin{pmatrix} 3&2&-5\\2&6&-10\\1&2&-3 \end{pmatrix}\),求\(A\)的Jordan标准形\(J\),并求可逆矩阵\(P\),使得\(P^{-1}AP=J\)
16.
\(A\in\mathbb{C}^{n\times n}\),证明:存在\(n\)阶可逆复对称矩阵\(P\),使得\(P^{-1}AP=A^T\)
17.
证明:与\(J(\lambda_0,n)\)可交换的矩阵一定可表示为\(J(\lambda_0,n)\)的多项式。