设$V$是是复数域$ \mathbb{C}$上的n维线性空间,$\varphi$是V上的线性变换,$A\in M_n(\mathbb{C})$是$\varphi$在某组基下的表示矩阵,
则我们有线性变换或矩阵的Jordan标准型理论. 具体的, 若设$\varphi$或A的初等因子为$
(\lambda-\lambda_1)^{r_1},(\lambda-\lambda_2)^{r_2},{\cdots},(\lambda-\lambda_k)^{r_k}$
则存在$V$的一组基$\{e_1,e_2,\cdots,e_n\}$使得$\varphi$在这组基下的表示阵为.
$$J=diag\{J(\lambda_1,r_1),J(\lambda_2,r_2),{\cdots},J(\lambda_k,r_k)\}.$$
Jordan标准型理论是深入研究线性变换的几何性质和矩阵的代数性质的重要工具.注意到Jordan块是构成Jordan标准型的基本成分.因此我们有必要仔细研究一下Jordan块背后具体的几何结构是什么呢?
为了叙述方便, 以下不妨设$\varphi$在V的一组基$\{e_1,e_2,\cdots,e_n\}$下的表示矩阵就是一个Jordan块.Jordan 标准型理论是深入研究线性变换的几何性质和矩阵的代数性质的重要工具. 注意到 Jordan 块是构成 Jordan 标准型的基本成分, 因此我们有必要仔细研究一下 Jordan 块背后具体的几何结构是什么呢?
为了叙述方便, 以下不妨设 $\varphi$ 在一组基 $\{e_1,e_2,\cdots,e_n\}$ 下的表示矩阵就是一个 Jordan 块 $$J(\lambda_0,n)=\begin{pmatrix}
\lambda_0 & & & & \\
1 & \lambda_0 & & &\\
& 1 & \ddots & & \\
& & \ddots & \ddots & \\
& & & 1&\lambda_0 \end{pmatrix},$$
由表示矩阵的定义可得 $$\varphi(e_1)=\lambda_0e_1+e_2,\,\,\varphi(e_2)=\lambda_0e_2+e_3,\,\,\cdots,\,\,\varphi(e_n)=\lambda_0e_n.$$
[1] 循环子空间
设$V$是数域$\mathbb{K}$的n维线性空间,$\varphi$是V上的线性变换.对任意的非零向量$\alpha{\in}V$,由$\alpha,\varphi(\alpha),\cdots,$张成的子空间$C(\varphi,\alpha)$称为向量$\alpha$关于线性变换$\varphi$的循环子空间,$\alpha$称为循环子空间$C(\varphi,\alpha)$的循环向量.由定义知道,$C(\varphi,\alpha)$是$\varphi$的不变子空间,而且是包含向量$\alpha$的最小不变子空间.
显然, $\varphi$ 的所有特征值都是 $\lambda_0$, 再由简单的计算可知, $\varphi$ 关于特征值 $\lambda_0$ 只有一个线性无关的特征向量 $e_1$, 其余的向量 $e_2,\cdots,e_n$ 都称为广义特征向量. 令 $\psi=\varphi-\lambda_0I_V$, 则有如下关系图: $$e_1\stackrel{\psi}{\rightarrow}e_2\stackrel{\psi}{\rightarrow}\cdots\stackrel{\psi}{\rightarrow}e_n\stackrel{\psi}{\rightarrow}0,$$ 这说明 $V=L(e_1,e_2,\cdots,e_n)=C(\psi,e_1)$ 是关于线性变换 $\psi$ 的循环空间, 其循环向量是 $e_1$ .
讲授相似标准形理论的传统方法是$\lambda$-矩阵的方法,这种方法在证明有理标准形和Jordan标准形的存在性的基础上,还能教会学生如何计算上述两种标准形,所以对初学者来说是一个较好的选择.而如果要用几何的方法建立相似标准形理论,那么循环子空间将在这一过程中起到举足轻重的作用.例如,由Cayley-Hamilton定理可以得到全空间关于根子空间的直和分解,而每一个根子空间又可以分分解为若干个循环子空间的直和,由此即可推导出Jordan标准形的存在性.虽然仍需要通过进一步的计算来确定Jordan标准形的形状,但循环子空间给予了Jordan标准形理论一个清晰的几何意义,让我们可以看清楚复杂问题的几何内涵.
[2] 不变子空间
我们知道 $\varphi$ 的特征多项式和极小多项式都等于 $(\lambda-\lambda_0)^n$ ,下面我们来找出 $V$ 的所有 $\varphi$-不变子空间.
方法一 显然 $V_i=L(e_i,e_{i+1},\cdots,e_n)\,(0\leq i\leq n)$ 都是 $\varphi$-不变子空间, 我们来证明 $V$ 只有这 $n+1$ 个 $\varphi$-不变子空间.
注意到 $\varphi$-不变子空间等价于 $\psi$-不变子空间,故可任取非零 $\psi$-不变子空间 $U$, 设 $$k=\min\{\,\,i\,\,|\,\,\exists\,u\in U,\,\,u=c_ie_i+c_{i+1}e_{i+1}\cdots+c_ne_n,\,\,\text{其中}\,c_i\neq 0\},$$ 则 $U\subseteq L(e_k,e_{k+1},\cdots,e_n)$. 另一方面, 取 $u\in U$, 使得 $u=c_ke_k+c_{k+1}e_{k+1}+\cdots+c_ne_n$, 其中 $c_k\not= 0$, 则由循环关系可得 $u=(c_kI_V+c_{k+1}\psi+\cdots+c_n\psi^{n-k})(e_k)$. 令 $g(\lambda)=c_k+c_{k+1}\lambda+\cdots+c_n\lambda^{n-k} $, 则容易看出 $(g(\lambda),\lambda^n)=1$, 于是存在 $u(\lambda),v(\lambda)$, 使得 $u(\lambda)g(\lambda)+v(\lambda)\lambda^n=1$. 在上式中代入 $\lambda=\psi$ 并作用在 $e_k$ 上可得 $$e_k=u(\psi)g(\psi)(e_k)+v(\psi)\psi^n(e_k)=u(\psi)(u)\in U,$$ 于是由循环关系可得 $e_i\in U\,(k\leq i\leq n)$, 从而 $U{\supseteq}L(e_k,e_{k+1},\cdots,e_n)$故$U=L(e_k,e_{k+1},\cdots,e_n)$
方法二 任取非零 $\varphi$-不变子空间 $U$, 容易证明限制变换 $\varphi|_U$ 的特征多项式是 $\varphi$ 的特征多项式 $(\lambda-\lambda_0)^n$ 的因式, 不妨设为 $(\lambda-\lambda_0)^k$, (实际上$\varphi$的极小多项式也是这个,请读者思考为啥,文末会给出解答)其中 $1\leq k\leq n$, 由Cayley-Hamilton 定理可知$\ O=(\varphi|_U-\lambda_0Id_V)^k=(\varphi-\lambda_0Id_V)^k|_U.$ 故可得$U\subseteq \mathrm{Ker}(\varphi-\lambda_0I_V)^k=\mathrm{Ker\,}\psi^k$. 任取 $v=\sum_{i=1}^nc_ie_i\in\mathrm{Ker\,}\psi^k$, 则 $$0=\psi^k(v)=c_{1}\psi^k(e_{1})+\cdots+c_{n-k}\psi^k(e_{n-k})=c_1e_{k+1}+\cdots+c_{n-k}e_{n},$$ 于是 $c_{1}=\cdots=c_{n-k}=0$, 从而 $\mathrm{Ker\,}\psi^k=L(e_{n-k+1},\cdots,e_n)$. 注意到 $\dim U=\deg(\lambda-\lambda_0)^k=k$, $\dim\mathrm{Ker\,}\psi^k=k$, 于是 $U=\mathrm{Ker\,}\psi^k=L(e_{n-k+1},\cdots,e_n)$.
[3] 极小性
由 Jordan 标准型理论可知, Jordan 块在相似关系下应该具有极小性, 或者称为不可再分性. 换言之, 不存在两个非零的 $\varphi$-不变子空间 $U,W$, 使得 $V=U\oplus W$.
证法一 由 [2] 的结论可知, 任一非零 $\varphi$-不变子空间都要包含特征向量 $e_n$, 故 $U\cap W\neq 0$, 因此它们不可能是直和.
证法二 用反证法, 如果有上述 $\varphi$-不变直和分解, 那么 $\varphi$ 限制在 $U,W$ 上都有关于特征值 $\lambda_0$ 的特征向量, 从而至少有两个线性无关的特征向量, 这与 $\varphi$ 只有一个线性无关的特征向量相矛盾.
方法三(从代数角度刘月提供)
由U是非零$\varphi$-不变子空间,故存在$0\not=\alpha{\in}U$,由于$0\not=\alpha{\in}V$
可设$\alpha=c_ie_i+\cdots+c_ne_n.其中c_i\not=0.$则$\alpha$在基$\{e_1,e_2,\cdots,e_n\}$下的坐标为$ \begin{pmatrix}
0\\ \vdots \\0\\c_i\\c_{i+1}\\ \vdots \\c_n\\ \end{pmatrix},$
$\varphi-\lambda_0Id_V $在基$\{e_1,e_2,\cdots,e_n\}$下的表示矩阵为
$\begin{pmatrix}
0 & & & & & \\
1 & 0 & & & &\\
& 1 & \ddots & & &\\
& & \ddots & 0 & &\\
& & & 1 &0 & \\
& & & & 1 &0 \\
\end{pmatrix},
则\begin{pmatrix}
0 & & & & &\\
1 & 0 & & & &\\
& 1 & 0 & & &\\
& &\ddots & \ddots & &\\
& & & \ddots &0 & \\
& & & & 1 &0 \\
\end{pmatrix}\ \begin{pmatrix}
0\\ \vdots \\ 0\\
c_i\\ c_{i+1}\\ \vdots \\ c_n\\
\end{pmatrix}=\begin{pmatrix} 0\\
\vdots \\ 0 \\ 0 \\ c_{i} \\ \vdots \\c_{n-1}\\
\end{pmatrix},$
则作用足够多个的$
\begin{pmatrix}
0 & & & & &\\
1 & 0 & & & &\\
& 1 & 0 & & &\\
& &\ddots & \ddots & &\\
& & & \ddots &0 & \\
& & & & 1 &0 \\
\end{pmatrix}^{n-i}\
\begin{pmatrix}
0\\ \vdots \\ 0 \\ c_i\\ c_{i+1}\\ \vdots \\ c_n\\ \end{pmatrix}=
\begin{pmatrix} 0\\ \vdots \\ 0\\ 0\\ \vdots \\ 0 \\ c_i\\ \end{pmatrix},$
即$c_ie_n{\in}U$,再由证法一即得
[4] 不可对角化性
五条可对角化判定准则:(n维线性空间$V$上的线性变换$\varphi$)
(1)$\varphi$有n个线性无关的特征向量.
(2)全空间V等于特征子空间的直和.
(3)$\varphi$的任一特征值的几何重数等于代数重数.
(4)$\varphi$的极小多项式无重根.
(5)或$\varphi$的初等因子都是一次的或$\varphi$的Jordan块都是一阶的.
这五条读者必须牢记!!!(一般来说都在复数域$\mathbb{C}$上考虑可对角化)
若 $n\geq 2$, 则由五条可对角化判定准则中的任何一条可知, $\varphi$ 不可对角化. 我们再从另一个角度来看这个问题, 我们有这么一个命题: $\varphi$ 可对角化的充要条件是对 $V$ 的任一 $\varphi$-不变子空间 $U$, 存在 $\varphi$-不变子空间 $W$, 使得 $V=U\oplus W$, 于是由 [3] 的结论可知, $\varphi$ 不可对角化.
[5] 从局部到整体的推广
接下去设 $\varphi$ 的初等因子组为 $(\lambda-\lambda_1)^{r_1}$, $(\lambda-\lambda_2)^{r_2}$, $\cdots$, $(\lambda-\lambda_k)^{r_k}$, 特征多项式为 $f(\lambda)$, 极小多项式为 $m(\lambda)$. 首先, 全空间是 $k$ 个循环子空间的直和, 即有 $$V=C(\varphi-\lambda_1I_V,e_1)\oplus C(\varphi-\lambda_2I_V,e_{r_1+1})\oplus\cdots\oplus C(\varphi-\lambda_kI_V,e_{n-r_k+1}).$$
其次, 若 $f(\lambda)\neq m(\lambda)$, 则存在某个特征值 $\lambda_0$, 它至少有两个初等因子, 从而其特征子空间的维数大于等于 2, 由此可看出 $V$ 有无穷个 $\varphi$-不变子空间. 若 $$f(\lambda)=m(\lambda)=(\lambda-\lambda_1)^{r_1}(\lambda-\lambda_2)^{r_2}\cdots(\lambda-\lambda_k)^{r_k},$$ 其中 $\lambda_1,\lambda_2,\cdots,\lambda_k$ 是 $\varphi$ 的全体不同的特征值, 令 $V_i=\mathrm{Ker}(\varphi-\lambda_iI_V)^{r_i}$ 为对应的根子空间, 则 $V=V_1\oplus V_2\oplus\cdots\oplus V_k$. 设 $\varphi|_{V_i}$ 的特征多项式为 $f_i(\lambda)$, 极小多项式为 $m_i(\lambda)$, 则由上篇文章可知, $f_i(\lambda)=m_i(\lambda)=(\lambda-\lambda_i)^{r_i}$. 任取 $V$ 的 $\varphi$-不变子空间 $U$, 设 $\varphi|_U$ 的特征多项式为 $g(\lambda)$, 则 $g(\lambda)\mid f(\lambda)$, 若设 $$g(\lambda)=(\lambda-\lambda_1)^{s_1}(\lambda-\lambda_2)^{s_2}\cdots(\lambda-\lambda_k)^{s_k},\,\,\,\,U_i=\mathrm{Ker}(\varphi|_U-\lambda_iI_U)^{s_i},$$ 则由上篇文章 可知, $U=U_1\oplus U_2\oplus\cdots\oplus U_k$, 其中 $U_i$ 是 $V_i$ 的 $\varphi$-不变子空间. 由 Part B 的结论写出 $U$ 的形状如$U=\mathrm{Ker}(\varphi-\lambda_iI_V)^{s_1}(\varphi-\lambda_iI_V)^{s_2}\cdots(\varphi-\lambda_iI_V)^{s_k} \ 其中0 \le s_i \le r_i $ 这样的 $\varphi$-不变子空间一共有 $(r_1+1)(r_2+1)\cdots(r_k+1)$ 个.
[6] 从复数域到一般数域的推广
设 $V$ 是数域 $\mathbb{K}$ 上的 $n$ 维线性空间, $\varphi$ 是 $V$ 上的线性变换, $\varphi$ 的初等因子组为 $P_1(\lambda)^{r_1}$, $P_2(\lambda)^{r_2}$, $\cdots$, $P_k(\lambda)^{r_k}$, 其中 $P_i(\lambda)$ 是 $\mathbb{K}$ 上的首一不可约多项式, $r_i\geq 1$. 我们给出一般数域上基于初等因子的两种广义 Jordan 标准型, 其中两种广义 Jordan 块为 $$(\mathrm{I})\,\,\,\,\,\,\,\,J(P_i(\lambda)^{r_i}))=\begin{pmatrix} F(P_i(\lambda)) & & & & \\ I & F(P_i(\lambda)) & & & \\ & I & \ddots & \ddots & \\ & & & \ddots & \\ & & & I & F(P_i(\lambda)) \end{pmatrix},$$ $$(\mathrm{II})\,\,\,\,\,\,\,\,\widetilde{J}(P_i(\lambda)^{r_i})=\begin{pmatrix} F(P_i(\lambda)) & & & & \\ C & F(P_i(\lambda)) & & & \\ & C & \ddots & \ddots & \\ & & & \ddots & \\ & & & C & F(P_i(\lambda)) \end{pmatrix},$$ 其中 $I$ 表示单位阵, $C$ 表示右上角元素为 1, 其余元素为零的矩阵.
在 我们看到: 第一类广义 Jordan 块比较适合矩阵带入多项式或幂级数进行整体计算 (由于单位阵的交换性);即
$ g(J(P_i(\lambda)^e))$=\begin{pmatrix}
g(F) & & & & &\\
g^{(1)}(F) & g(F) & & & &\\
\frac{g^{(2)}(F)}{2!} & g^{(1)}(F) & g(F) & & &\\
\vdots & \ddots &\ddots & \ddots & &\\
\frac{g^{(e-2)}(F)}{(e-2)!}&\cdots & \cdots & \ddots &g(F) & \\
\frac{g^{(e-1)}(F)}{(e-1)!}&\frac{g^{(e-2)}(F)}{(e-2)!} &\cdots &\cdots & g^{(1)}(F) &g(F) \\
\end{pmatrix}
而第二类广义 Jordan 块比较适合考虑基向量在线性变换作用下的关系, 此时第二类广义 Jordan 块对应的空间是一个循环空间, 第一个基向量就是循环向量.
不妨设$P(\lambda)=\lambda^d+a_1\lambda^{d-1}+\cdots+a_{d-1}\lambda+a_d.$
全空间V的一组基记为$\{e_{1,1},e_{1,2},\cdots,e_{1,d},e_{2,1},e_{2,2},\cdots,e_{r,1},\cdots,e_{r,d}\}$容易验证$\varphi(e_{1,1})=e_{1,2},\varphi(e_{1,2})=e_{1,3},\cdots,\varphi(e_{1,d-1})=e_{1,d}.$
$\varphi(e_{1,d})=-a_de_{1,1}-a_{d-1}e_{1,2}-\cdots-a_1e_{1,d}+e_{2,1}———(*)$.以此类推.但是不要硬算.我们注意到(*)可写为
$\varphi^d(e_{1,1})=-a_de_{1,1}-a_{d-1}\varphi(e_{1,1})-\cdots-a_1\varphi^{d-1}e_{1,1}+e_{2,1}$.即$P(\varphi)(e_{1,1})=e_{2,1}$,$有P(\varphi)^{i-1})(e_{1,1})=e_{i,1}$也有$\varphi(P(\varphi)^{i-1})(e_{1,1})=\varphi(e_{i,1})$,由于$\varphi$与$P(\varphi)$可交换.故$P(\varphi)^{i-1}(e_{1,2})=(e_{i,2})$故$P(\varphi)^{i-1}(e_{1,j})=(e_{i,j})对\forall 1 \le i\le r , 1 \le j \le d.P(\varphi)^{r}(e_{i,j})=0$.因此$e_{1,1}$是循环向量每次作用$\varphi$后能生成后一个基向量或者是有前面的线性组合和后一个基向量.
或者根据上面第二类广义 Jordan 块和[2]完全类似的讨论可得: 设 $\varphi$ 的特征多项式为 $f(\lambda)$, 极小多项式为 $m(\lambda)$, 若 $$f(\lambda)=m(\lambda)=P_1(\lambda)^{r_1}P_2(\lambda)^{r_2}\cdots P_k(\lambda)^{r_k},$$ 其中 $P_i(\lambda)$ 是 $\mathbb{K}$ 上互异的首一不可约多项式, 则 $\varphi$-不变子空间共有 $(r_1+1)(r_2+1)\cdots (r_k+1)$ 个; 若 $f(\lambda)\neq m(\lambda)$, 则 $V$ 有无穷个 $\varphi$-不变子空间.
数域 $\mathbb{K}$ 上线性变换的不可再分性由下列命题刻画,
命题 设 $V$ 是数域 $\mathbb{K}$ 上的 $n$ 维线性空间, $\varphi$ 是 $V$ 上的线性变换, $\varphi$ 的特征多项式为 $f(\lambda)$, 极小多项式为 $m(\lambda)$, 则 $V$ 不能分解成两个非零 $\varphi$-不变子空间的直和的充要条件是 $f(\lambda)=m(\lambda)=P(\lambda)^r$, 其中 $P(\lambda)$ 是 $\mathbb{K}$ 上的首一不可约多项式, $r\geq 1$.
设 $V$ 是数域 $\mathbb{K}$ 上的 $n$ 维线性空间, $\varphi$ 是 $V$ 上的线性变换, 满足 $\varphi$ 的特征多项式等于其极小多项式, 证明: 对 $V$ 的任一非零 $\varphi$-不变子空间 $U$, 限制变换 $\varphi|_U$ 的特征多项式也等于其极小多项式.
主要参考文献:(1)谢启鸿博客Jordan标准型的几何构造
(2)高等代数教学辅导4.6节不变子空间第5题.
(3)循环子空间的若干应用.谢启鸿.