主要内容

高等代数 多项式与线性代数

7.9 Jordan标准型与空间分解

节 7.2中可以看到:表示矩阵的分块对角化与空间的不变子空间直和分解是对应的。Jordan标准型矩阵是一个分块对角矩阵,借助Jordan标准型的相关结论,我们可以把一个线性变换分解到一些小的不变子空间上去进行理解。同时,每一个Jordan块本身也是非常简单的矩阵,其对应的线性变换也有明显的几何特征。借助Jordan标准型,本节的主要目标是帮助读者建立对一般线性变换作用效果的直观理解。
本节将介绍两种空间分解方式,分别是循环子空间分解及根子空间分解。本节最后还会介绍线性变换的Jordan-Chevalley分解。

子节 7.9.1 循环子空间分解

我们先来理解一个Jordan块对应线性变换的作用效果。设线性变换 \(\phi\)在基 \((\varepsilon_1,\dots,\varepsilon_k)\)下的表示矩阵恰好是一个以 \(\lambda_0\)为对角元的Jordan块,即
\begin{equation*} \phi(\varepsilon_1,\dots,\varepsilon_k) = (\varepsilon_1,\dots,\varepsilon_k)\begin{pmatrix} \lambda_0 & & &\\ 1 & \lambda_0 & &\\ &\ddots & \ddots & \\ & & 1 & \lambda_0 \end{pmatrix}. \end{equation*}
分开书写可得
\begin{align*} \phi(\varepsilon_1) \amp = \lambda_0 \varepsilon_1 +\varepsilon_2, \\ \phi(\varepsilon_2) \amp = \lambda_0 \varepsilon_2 +\varepsilon_3, \\ \amp \vdots \\ \phi(\varepsilon_{k-1}) \amp = \lambda_0 \varepsilon_{k-1} + \varepsilon_k, \\ \phi(\varepsilon_k) \amp = \lambda_0 \varepsilon_k. \end{align*}
将含有\(\lambda_0\)的项移至左端并整理,记 \(\psi = \phi -\lambda_0 {\rm id}_V\) 上式可被改写为
\begin{align*} \psi (\varepsilon_1) \amp = \varepsilon_2,\\ \psi (\varepsilon_2) \amp =\varepsilon_3,\\ \amp \vdots \\ \psi (\varepsilon_{k-1}) \amp = \varepsilon_k,\\ \psi (\varepsilon_k) \amp= 0, \end{align*}
也就是说
\begin{equation*} (\varepsilon_1,\varepsilon_2,\varepsilon_3,\dots,\varepsilon_k) = (\varepsilon_1,\psi(\varepsilon_1),\psi^2(\varepsilon_1)\dots,\psi^{k-1}(\varepsilon_{1})). \end{equation*}
我们引入如下术语。

定义 7.9.1.

\(U\)是线性空间\(V\)\(k\)维子空间。若存在\(\varepsilon\in U\),使
\begin{equation*} (\varepsilon,\psi(\varepsilon), \psi^2(\varepsilon),\dots,\psi^{k-1}(\varepsilon)) \end{equation*}
\(U\)的一个基且\(\psi^k(\varepsilon)= 0\),则称\(U\)为线性变换\(\psi\)循环子空间。此时,称 \((\varepsilon,\psi(\varepsilon), \psi^2(\varepsilon),\dots,\psi^{k-1}(\varepsilon))\)\(U\)的一个循环基
结合例 7.2.5,循环子空间是包含\(\varepsilon\)的最小不变子空间。
先从代数的角度理解\(\psi\)在其循环子空间 \(U\)上的作用效果:对 \(\forall \alpha\in U\),记其在循环基\((\varepsilon,\psi(\varepsilon), \psi^2(\varepsilon),\dots,\psi^{k-1}(\varepsilon))\)下的坐标为
\begin{equation*} X=(x_1,x_2,\dots,x_{k-1},x_k)^T, \end{equation*}
\(\alpha\)的像\(\psi(\alpha)\)在同一个基下的坐标为
\begin{equation*} Y = (0,x_1,x_2,\dots,x_{k-1})^T\text{.} \end{equation*}
接下来我们以循环子空间 \(U=\R^3\)为例,尝试建立\(\psi\)在其上作用效果的几何直观。不妨设三个坐标轴上的单位坐标向量 \(i,j,k\)构成了循环基。则从向量 \((x,y,z)^T\)变成\((0,x,y)^T\)可以理解为先把空间中的向量向\(xoy\)平面做投影,然后把\(xoy\)平面旋转至\(yoz\)平面,使得原\(x\)轴与\(y\)轴重合、原\(y\)轴与\(z\)轴重合,变化过程中原\(z\)轴塌缩至坐标原点。
回到线性变换\(\phi\)。注意到在其一个Jordan块所对应的不变子空间\(U\)上,\(\phi = \psi +\lambda_0 {\rm id}_V\)\(\phi\)\(U\)上的作用效果可以按照\(\psi\)的作用效果叠加\(\lambda_0\)倍的伸缩变换效果来进行想象。
现在回到全空间\(V\)。设\(\phi\)\(\mathbb{C}\)\(n\)维线性空间\(V\)的线性变换, 记其初等因子组为:
\begin{equation*} (\lambda- \lambda_1)^{e_1},\dots, (\lambda - \lambda_m)^{e_m}, \end{equation*}
则存在\(V\)的一个基\(\varepsilon_1,\ldots,\varepsilon_n\),使得
\begin{equation*} \phi(\varepsilon_1,\ldots,\varepsilon_n)=(\varepsilon_1,\ldots,\varepsilon_n) \begin{pmatrix} J(\lambda_1,e_1) & & \\ & \ddots& \\ & & J(\lambda_m,e_m) \end{pmatrix} \end{equation*}
其中\(e_1+\cdots+e_m=n\)
\begin{equation*} V(\lambda_1,e_1)= \langle \varepsilon_1,\ldots ,\varepsilon_{e_1}\rangle, \end{equation*}
\begin{align*} \phi(\varepsilon_1)& = \lambda_1 \varepsilon_1 + \varepsilon_2,\\ & \cdots \\ \phi(\varepsilon_{e_1-1})& = \lambda_1 \varepsilon_{e_1-1} + \varepsilon_{e_1},\\ \phi(\varepsilon_{e_1})& = \lambda_1 \varepsilon_{e_1}. \end{align*}
\(V(\lambda_1,e_1)\)\(\phi - \lambda_1{\rm id}_V \)的循环子空间。
同理,令
\begin{equation*} V(\lambda_j,e_j) = \langle \varepsilon_{t_j+1},\ldots,\varepsilon_{t_j+e_j}\rangle, \end{equation*}
其中\(t_j=e_1+\cdots+e_{j-1}\),即\(V(\lambda_j, e_j)\)对应Jordan块\(J(\lambda_j, e_j)\),对应初等因子\((\lambda- \lambda_j)^{e_j}\),则\(V(\lambda_j,e_j)\)也是一个循环子空间,故有循环子空间的直和分解
\begin{equation*} V = V(\lambda_1,e_1)\oplus \cdots\oplus V(\lambda_k,e_k). \end{equation*}
综上所述,有下面的结论。

证明.

只需证明每个\(V(\lambda_i, e_i)\)不能分解成为两个非零\(\phi\)-子空间的直和。事实上,已知\(J(\lambda_i,e_i)\)的初等因子组为\((\lambda-\lambda_i)^{e_i}\)。若\(V(\lambda_i, e_i)\)可以分解为两个非平凡的\(\phi\)-子空间的直和\(V(\lambda_i, e_i) = V_1\oplus V_2\),将\(V_1,V_2\)的基凑成\(V(\lambda_i, e_i)\)的基,则\(\phi|_{V(\lambda_i, e_i)}\)在该基下的表示矩阵为分块对角阵\({\rm diag}(A_1,A_2) \)。因此,\(J(\lambda_i, e_i)\)相似于\({\rm diag}(A_1,A_2) \)。因为\(A_1,A_2\)分别至少含有一个初等因子,所以\({\rm diag}(A_1,A_2) \)的初等因子组至少含有两个初等因子,这与\(J(\lambda_i, e_i)\)的初等因子组只有一个初等因子矛盾。

子节 7.9.2 根子空间直和分解与Jordan-Chevalley分解定理

将特征值相同的循环子空间合并在一起,可以获得另一种常见空间分解——根子空间直和分解。

定义 7.9.3.

\(\lambda_0\)\(\mathbb{C}\)\(n\)维空间\(V\)上线性变换\(\phi\)的特征值,且\(\lambda_0\)\(m_{\phi}(\lambda)\)\(s_0\)重根。则
\begin{equation*} R(\lambda_0)=\{\alpha\in V | (\phi- \lambda_0{\rm id}_V)^{s_0}(\alpha) = 0\} \end{equation*}
\(V\)\(\phi\)-子空间,称为属于特征根\(\lambda_0\)根子空间

证明.

\(\alpha = a_1\varepsilon_1 + a_2\varepsilon_2 + \cdots + a_{e_i}\varepsilon_{e_i}\),其中\((\varepsilon_1,\varepsilon_2,\ldots,\varepsilon_{e_i})\)\(V(\lambda_i,e_i)\)的循环基,则
\begin{equation*} (\phi - \lambda_i{\rm id}_V)(\alpha) = a_1\varepsilon_2 + a_2\varepsilon_3 + \cdots + a_{e_i-1}\varepsilon_{e_i} + a_{e_i}\varepsilon_{e_i}. \end{equation*}
继续迭代,直到第\(e_i\)次迭代时,\(\phi - \lambda_i{\rm id}_V\)作用于\(\alpha\)的结果为零。

证明.

\(f(\lambda) = m_{\phi}(\lambda)\)\(f_i(\lambda) = (\lambda-\lambda_i)^{s_i}, i=1,\dots,t\),由于\(\lambda_1,\dots,\lambda_t\)两两不同,\(f_i(\lambda)\)两两互素,根据准素分解引理( 引理 7.5.16 ),
\begin{equation*} V = R(\lambda_1)\oplus\cdots\oplus R(\lambda_t). \end{equation*}
对每一个\(i\),记以\(\lambda_i\)为根的所有初等因子为
\begin{equation*} (\lambda-\lambda_i)^{e_{i1}},\dots, (\lambda-\lambda_i)^{e_{it_i}}, \end{equation*}
其中
\begin{equation*} 1\le e_{i1}\le \dots \le e_{it_i} = s_i,\quad e_{i1}+\cdots+e_{it_i}=n_i. \end{equation*}
根据引理 7.9.4,由于\(e_{ik}\le s_i\),所以每一个循环子空间\(V(\lambda_i,e_{ik})\)都是根子空间\(R(\lambda_i)\)的子空间,记
\begin{equation*} V_i = V(\lambda_i,e_{i1})\oplus\cdots \oplus V(\lambda_i,e_{it_i}), \end{equation*}
\(V_i\subseteq R(\lambda_i) \),所以
\begin{equation*} \dim R(\lambda_i) \ge \dim V_i = e_{i1}+\cdots + e_{it_i} = n_i. \end{equation*}
另一方面,
\begin{equation*} n = \dim V = \dim R(\lambda_1) + \cdots + \dim R(\lambda_t) \ge n_1+\cdots+n_t =n, \end{equation*}
所以对每一个\(i\),均有
\begin{equation*} \dim R(\lambda_i) = n_i= \dim V_i, \end{equation*}
于是\(R(\lambda_i)= V_i\),即\(R(\lambda_i)\)\(\phi-\lambda_i{\rm id}_V \)的所有循环子空间的直和。

证明.

\(\phi\)的极小多项式为
\begin{equation*} m_{\phi}(\lambda) = (\lambda-\lambda_1)^{e_1}\cdots(\lambda-\lambda_t)^{e_t}, \end{equation*}
\begin{equation*} V= R(\lambda_1)\oplus\cdots\oplus R(\lambda_t), \end{equation*}
其中\(R(\lambda_i)= {\rm Ker}(\phi-\lambda_i {\rm id}_V)^{e_i}\ (i=1,\dots t)\)
由于\((\lambda-\lambda_1)^{e_1},\dots,(\lambda-\lambda_t)^{e_t}\)两两互素,根据孙子定理( 定理 1.3.18 ),存在多项式\(g(\lambda)\)\(q_i(\lambda), (i=1,\dots t)\),使得对任意的\(i\)
\begin{equation*} g(\lambda)-\lambda_i=q_i(\lambda)(\lambda-\lambda_i)^{e_i}. \end{equation*}
\(h(\lambda) = \lambda -g(\lambda)\)。令\(\psi = g(\phi)\)\(\delta = h(\phi)\),则有
\begin{equation*} \phi = \psi+\delta,\quad \psi\delta =\delta\psi. \end{equation*}
对于任意的\(\alpha_i\in R(\lambda_i)\)\(\alpha_i\in {\rm Ker} (\phi-\lambda_i{\rm id}_V)^{e_i}\),有
\begin{equation*} [g(\phi)- \lambda_i{\rm id}_V](\alpha_i) = q_i(\phi)(\phi-\lambda_i{\rm id}_V)^{e_i}(\alpha_i) =0, \end{equation*}
所以
\begin{equation*} \psi(\alpha_i)= g(\phi)(\alpha_i) = \lambda_i\alpha_i\ (i=1,\dots,t), \end{equation*}
即每一个根子空间\(R(\lambda_i)\)都是\(\psi\)的特征子空间,所以\(\psi\)可对角化。
另一方面,
\begin{equation*} \delta^{e_i}(\alpha_i) = h(\phi)^{e_i}(\alpha_i) = (\phi-g(\phi))^{e_i}(\alpha_i) = (\phi-\lambda_i{\rm id}_V)^{e_i}(\alpha_i) = 0. \end{equation*}
\(e =\max\{e_1,\dots,e_t\} \),则
\begin{equation*} \delta^{e}(\alpha_i)= 0 \end{equation*}
对任意的\(i\)和任意的\(\alpha_i\in R(\lambda_i)\)都成立。
对任意的\(\alpha \in V =R(\lambda_1)\oplus\cdots\oplus R(\lambda_t) \),根据空间分解方式,存在\(\alpha_i\in R(\lambda_i) (i=1,\dots,t)\),使得
\begin{equation*} \alpha = \alpha_1+\cdots+\alpha_t. \end{equation*}
于是
\begin{equation*} \delta^e(\alpha) = \delta^e(\alpha_1+\cdots+\alpha_t) = \delta^e(\alpha_1)+\cdots+\delta^e(\alpha_t)=0, \end{equation*}
所以\(\delta\)是一个幂零线性变换。
下面证明分解的唯一性。设\(\phi\)有两个满足条件的分解式
\begin{equation*} \phi = \psi+\delta = \psi_1+\delta_1. \end{equation*}
因为\(\psi,\psi_1\)都是\(\phi\)的多项式,所以\(\psi,\psi_1\)可交换,从而可以同步对角化,进而可知\(\psi-\psi_1\)可对角化。
另一方面,设\(\delta^s=0\)\(\delta_1^k=0\),由于\(\delta,\delta_1\)可交换,
\begin{equation*} (\delta -\delta_1)^{s+k} = \sum_{i=0}^{s+k} C_{s+k}^i \delta^{s+k-i}(-\delta_1)^i = 0. \end{equation*}
于是可知\(\psi-\psi_1 = \delta_1-\delta\)既可对角且是幂零的线性变换,故只能是0线性变换,即
\begin{equation*} \psi = \psi_1,\quad \delta = \delta_1, \end{equation*}
所以分解式唯一。

练习 7.9.3 练习

基础题.

1.
\(\varphi\)\(\mathbb{C}\)\(4\)维线性空间\(V\)的线性变换,\(\xi_1,\xi_2,\xi_3,\xi_4\)\(V\)的一个基,使得
\begin{equation*} \varphi(\xi_1,\xi_2,\xi_3,\xi_4)=(\xi_1,\xi_2,\xi_3,\xi_4)\begin{pmatrix} 1&&&\\ 1&1&&\\ &&1&\\ &&&2 \end{pmatrix}. \end{equation*}
  1. \(\varphi\)的属于特征值\(1\)的特征子空间的一组基;
  2. 求属于特征值\(1\)的根子空间的维数。
2.
已知线性变换\(\varphi:\mathbb{F}^3\rightarrow\mathbb{F}^3,X\mapsto AX\),其中\(A=\begin{pmatrix} -2&1&3\\ -2&1&2\\ -1&1&2 \end{pmatrix}\),试求\(\varphi\)的所有根子空间的基和维数。

提高题.

3.
\(\varphi\)\(\mathbb{C}\)\(n\)维线性空间\(V\)的线性变换,\(A\)\(\varphi\)在某组基下的矩阵。证明:\(V\)的每个根子空间都是循环子空间的充要条件是\(A\)的第\(n\)个行列式因子\(D_n(\lambda)\)和第\(n\)个不变因子\(g_n(\lambda)\)相等。
4.
\(\varphi\)是数域\(\mathbb{F}\)\(n\)维线性空间\(V\)的线性变换,证明下列叙述等价:
  1. \(V\)只有平凡的\(\varphi\)-不变子空间;
  2. \(V\)中每个非零向量\(\alpha\)都是循环向量,使\(V\)成为循环空间,即总有\(\alpha,\varphi (\alpha),\cdots ,\varphi^{n-1}(\alpha)\)线性无关;
  3. \(\varphi\)的特征多项式在\(\mathbb{F}\)上不可约。

挑战题.