可对角化

节 7.4 可对角化

上一节中证明了所有的复矩阵都相似于上三角矩阵。相对于普通上三角阵，对角矩阵是更为简单的一类矩阵。对角矩阵作为列向量空间上的线性变换，其变换规律也是较为明显的。本节中我们探讨满足哪些性质的矩阵可以相似于对角矩阵；如果个可以相似于对角阵，该如何寻找相应的过渡矩阵。

子节 7.4.1 矩阵的可对角化条件

设\(A\)是数域\(\mathbb{F}\)上\(n\)阶方阵。若存在\(\mathbb{F}\)上可逆阵\(P\)，使得\(P^{-1}AP\)为对角阵，则称\(A\)在数域\(\mathbb{F}\)上是可对角化的。

并不是所有的矩阵都可对角化，例如下面的例子。

例 7.4.1.

证明矩阵

\begin{equation*} A = \begin{pmatrix} \lambda & 1 & & \\ &\lambda & \ddots & \\ & & \ddots &1\\ & & & \lambda \end{pmatrix}_{n\times n} \end{equation*}

不可对角化，其中\(n\ge 2\)。

解答.

使用反证法，假设\(A\)可以相似于对角矩阵\(B\)。注意到\(A\)是一个上三角矩阵，且其所有对角元都是\(\lambda\)，则此时\(B\)的所有对角元也是\(\lambda\)，于是\(B= \lambda E\)。对任意的一个可逆矩阵\(P\)，

\begin{equation*} P^{-1}BP=\lambda P^{-1}EP = \lambda E\ne A, \end{equation*}

矛盾。

例 7.4.2.

矩阵\(A = \begin{pmatrix} 0 & 1\\ -1 & 0 \end{pmatrix}\)在实数域上不可对角化，但在复数域上可对角化。

解答.

经计算可知\(\chi_A(\lambda)=\lambda^2+1\)，所以\(A\)在实数域上没有特征值，自然也不可能相似于实对角矩阵。

解线性方程组\((iE-A)x=0\)，得到特征值\(i\)的1个特征向量（线性方程组的基础解系）\(v_1 = (1,i)^T\)，

矩阵是否可对角化与数域有关，主要原因是除复数域外的数域\(\F\)，\(\F[x]\)中多项式的根不一定仍落在\(\F\)中。此种情况下，只需扩大数域至复数域就可以了。我们重点关心的是矩阵在复数域上是否可对角化，所以在没有明确提及数域时，默认的数域是复数域。

矩阵可对角化和矩阵可逆一样，是矩阵的常用性质，有很多充分必要条件。下面是矩阵可对角化的第一个等价条件。

定理 7.4.3.

设\(A\in\mathbb{F}^{n\times n}\)。则\(A\)可对角化的一个充要条件是\(A\)有\(n\)个线性无关特征向量。

证明.

充分性：设\(\xi_1,\dots,\xi_n\)是\(A\)的\(n\)个线性无关特征向量，对应的特征值分别为\(\lambda_1,\dots,\lambda_n\)，则

\begin{equation*} A(\xi_1,\dots,\xi_n) = (\xi_1,\dots,\xi_n) \begin{pmatrix} \lambda_1 & &\\ &\ddots &\\ & & \lambda_n \end{pmatrix}. \end{equation*}

由于\(\xi_1,\dots,\xi_n\)线性无关，所以矩阵\(P=(\xi_1,\dots,\xi_n)\)可逆，可得 \(P^{-1}AP \)是对角矩阵，即\(A\)可对角化。

必要性：若\(A\)可对角化，则存在可逆矩阵\(P\)，使得\(P^{-1}AP\)为对角阵。记\(P\)的列向量组为\(\xi_1,\dots,\xi_n\)，\(P\)的可逆性保证了\(\xi_1,\dots,\xi_n\)线性无关。易知\(\xi_1,\dots,\xi_n\)就是\(A\)的\(n\)个线性无关特征向量。

接下来从每一个特征值的角度来理解可对角化。

引理 7.4.4.

设\(A\)是\(n\)阶方阵，\(\lambda_0\)是\(A\)的特征值。设\(\lambda_0\)是\(A\)的特征多项式的\(n_0\)重根，\(\lambda_0\)的特征子空间\(V_{\lambda_0}\)的维数为\(s_0\)，则\(s_0\leq n_0\)。

证明.

根据定理 7.3.20，存在一个可逆矩阵\(P\)，使得\(B = P^{-1}AP\)是一个上三角矩阵，此时\(B\)的对角元恰好就是\(A\)的特征值。\(\lambda_0\)是\(A\)的特征多项式的\(n_0\)重根等同于\(B\)的对角元中恰好有\(n_0\)个\(\lambda_0\)。

另一方面，\(\lambda_0\)的特征子空间\(V_{\lambda_0}\)的维数\(s_0\)也就是线性方程组\((\lambda_0 E -A)x=0\)的维数，根据解空间维数公式（定理 4.5.3 ），

\begin{equation} s_0 = n - r(\lambda_0 E -A).\tag{7.4.1} \end{equation}

注意到

\begin{equation*} \lambda_0 E -B =P^{-1}(\lambda_0 E -A)P, \end{equation*}

所以\(r(\lambda_0 E -A)=r(\lambda_0 E -B)\)。而矩阵\(\lambda_0 E -B\)是一个上三角阵，且恰好有\(n_0\)个对角元是0，其余\(n-n_0\)个对角元不是0，所以

\begin{equation*} r(\lambda_0 E -A)\ge n -n_0, \end{equation*}

将之代入 (7.4.1) 可得

\begin{equation*} s_0\le n_0. \end{equation*}

为方便记忆和叙述，可以引入下面的术语。

定义 7.4.5.

设\(\lambda_0\)是\(n\)阶方阵\(A\)的特征值。我们称\(\lambda_0\)作为\(\chi_A(\lambda)\)的根的重数\(n_0\)为\(\lambda_0\)的代数重数；称\(\lambda_0\)的特征子空间\(V_{\lambda_0}\)的维数\(s_0\)为\(\lambda_0\)的几何重数。

引理 7.4.4说明：矩阵特征值的几何重数必定小于等于代数重数。

定理 7.4.6.

设\(A\)是数域\(\mathbb{F}\)上\(n\)阶方阵，则下列命题等价：

\(A\)在\(\mathbb{F}\)上可对角化；
\(A\)在\(\mathbb{F}\)上有\(n\)个线性无关的特征向量；
\(\chi_A(\lambda)\)的根全在\(\mathbb{F}\)上，且每个特征值的代数重数等于几何重数。
\(A\)的所有特征子空间维数之和为\(n\)，也即全空间\(\F^n\)可以分解为特征值子空间的直和。

证明.

条件1与2的等价性在定理 7.4.3中已经得到了证明。下面证明它们与其它条件的等价性。

设\(\lambda_1,\dots,\lambda_t\)是\(A\)在\(\mathbb{F}\)上的所有不同特征值，\(\lambda_i\)的代数重数记为\(n_i\)，几何重数记为\(s_i\)，\(i=1,\dots,t\)。则\(\sum_{i=1}^t n_i\le n\)，且当且仅当\(\chi_A(\lambda)\)的根全在\(\mathbb{F}\)上时，\(\sum_{i=1}^t n_i= n\)。

\(2\Rightarrow 3\)：矩阵的特征向量均来自于各自所在的特征子空间，每一个特征子空间\(V_{\lambda_i}\)可以最多提供几何重数\(s_i\)个线性无关的特征向量，于是线性无关的特征向量个数不会超过几何重数的和\(\sum_{i=1}^t s_i\)，即

\begin{equation*} n\le \sum_{i=1}^t s_i. \end{equation*}

另一方面，根据引理 7.4.4，对每一个\(i\)均有\(s_i\le n_i\)，于是

\begin{equation*} n\le \sum_{i=1}^t s_i\le \sum_{i=1}^t n_i= n, \end{equation*}

故对每一个\(i\)，\(s_i= n_i\)，且\(\sum_{i=1}^t n_i= n\)，即条件3成立。

\(3\Rightarrow 4\)：\(\chi_A(\lambda)\)的根全在\(\mathbb{F}\)上，且每个特征值的代数重数等于几何重数，所以

\begin{equation*} \sum_{i=1}^t s_i = \sum_{i=1}^t n_i= n. \end{equation*}

结合推论 7.3.16，可知条件4成立。

\(4\Rightarrow 1\)：因为

\begin{equation*} \F^n =V_{\lambda_1}\oplus\cdots\oplus V_{\lambda_t}, \end{equation*}

根据直和的性质，在每一个\(V_{\lambda_i}\)中取基\((\eta_{i1},\dots,\eta_{is_i})\)，则这些基向量放在一起可以构成\(\F^n\)的基。记

\begin{equation*} P=(\eta_{11},\dots,\eta_{1s_1},\dots,\eta_{t1},\dots,\eta_{ts_t}), \end{equation*}

则\(P\)是可逆矩阵。注意到\(P\)的每一列向量都是特征向量，记

\begin{equation*} AP =P B, \end{equation*}

则\(B\)是对角阵，即条件1成立。

由于实数域的特殊重要性，所以有下面的推论。

推论 7.4.7.

设\(A\in \R^{n\times n}\)是\(n\)阶实方阵。若\(A\)的所有特征值都是实数，则下列命题等价：

\(A\)在\(\mathbb{C}\)上可对角化；
\(A\)在\(\mathbb{R}\)上可对角化；
\(A\)有\(n\)个线性无关的实特征向量。

证明.

为了区别，用\(_{\C}V_{\lambda_j} \)和\(_{\R}V_{\lambda_j} \)分别表示矩阵\(A\)在复数域和实数域上相应于同一个实特征值\(\lambda_j\)的特征子空间，\(_{\C}s_j\)和\(_{\R}s_j\)分别表示\(\lambda_j\)在复数域和实数域上的几何重数。注意到

\begin{equation*} _{\C}s_j = \dim\ _{\C}V_{\lambda_j} = n -r(\lambda_jE-A)=\dim\ _{\R}V_{\lambda_j}= _{\R}s_j, \end{equation*}

所以结论成立。

当一个特征值的代数重数是1时，根据引理 7.4.4，其几何重数必定也是1，所以有下面的推论。

推论 7.4.8.

设矩阵\(A\)在\(\mathbb{F}\)上有\(n\)个不同特征值，则\(A\)在 \(\mathbb{F}\)上必可对角化。

作为这一小节的总结，结合推论 7.3.16，我们给出判断\(A\)是否可对角化和求可逆阵\(P\)的一般流程：

计算\(A\)的特征多项式\(\chi_A(\lambda)\)；
求\(\chi_A(\lambda)\)的所有根。若不是所有根都在\(\mathbb{F}\)上，则\(A\)在\(\mathbb{F}\)上不可对角化；
当所有特征值都在\(\mathbb{F}\)上时，若某特征值的代数重数不等于几何重数，则\(A\)在\(\mathbb{F}\) 上不可对角化；
记所有不同特征值为\(\lambda_1,\dots,\lambda_t\)（均属于\(\mathbb{F}\)），若对每个特征值\(\lambda_i\)，有\(s_i=n_i\)，则\(A\)可对角化。

下面来求过渡矩阵\(P\)。对每一个\(i(i=1,\dots ,t)\)，求\((\lambda_iE-A)X=0\)的基础解系，记为\(\eta_{i1},\dots ,\eta_{is_i}\)。则这些基础解系中的向量可以凑成\(\mathbb{F}^n\)的一个基\((\eta_{11},\dots,\eta_{1s_1},\eta_{21},\dots,\eta_{2s_2},\dots ,\eta_{t1},\dots,\eta_{ts_t})\)。以这个基作为列向量组的矩阵\(P=(\eta_{11},\dots,\eta_{ts_t})\)是一个可逆矩阵，且\(P^{-1}AP\)为对角矩阵，对角元分别是\(A\)的相应特征值。

来看一个具体的例子。

例 7.4.9.

判断以下矩阵是否可对角化。若可以，求可逆矩阵\(P\)，使得\(P^{-1}AP\)是对角矩阵，并求\(A^{10}\)。

\(A=\begin{pmatrix} -1 & 4 & 8 \\ 4 & -7 & 4 \\ 8 & 4 & -1\end{pmatrix}\)；
\(A=\begin{pmatrix}0&2\\-2&0\end{pmatrix}\)；
\(A=\begin{pmatrix}3&1&-1\\2&2&-1\\2&2&0\end{pmatrix}\)。

解答.

计算特征多项式

\begin{equation*} \det(\lambda E - A) = \begin{vmatrix}\lambda+1 & -4 & -8 \\ -4 & \lambda+7 & -4 \\ -8 & -4 & \lambda+1\end{vmatrix} = (\lambda-9)(\lambda+9)^2. \end{equation*}

于是\(A\)有两个不同特征值\(\lambda_1 = 9\)，\(\lambda_2 = -9\)；其中\(\lambda_1\)的代数重数为1（故几何重数也是1），\(\lambda_2\)的代数重数为2。可能影响\(A\)是否可对角化的是\(\lambda_2\)，因此我们先来处理\(\lambda_2\)的相关问题。

对特征值\(\lambda_2 = -9\)，解线性方程组\((A+9E)x=0\)，用Gauss消去法可获得矩阵\(A+9E\)的简化阶梯型为：

\begin{equation*} \begin{pmatrix} 1 & \frac{1}{2} & 1 \\ 0 & 0 & 0\\ 0 & 0 & 0 \end{pmatrix}, \end{equation*}

可知\(\lambda_2\)的几何重数为2，与代数重数相同，所以矩阵\(A\)可对角化。

下面来求过渡矩阵\(P\)。

对特征值\(\lambda_1 = 9\)，解线性方程组\((9E-A)x=0\)，取其基础解系为

\begin{equation*} \eta_{11} = (2,1,2)^T. \end{equation*}

对特征值\(\lambda_2 = -1\)，取\((A+9E)x=0\)的基础解系为

\begin{equation*} \eta_{21} = (1,-2,0)^T, \quad \eta_{22} =(1,0,-1)^T. \end{equation*}

取

\begin{equation*} P=(\eta_{11},\eta_{21},\eta_{22}) = \begin{pmatrix} 2 & 1 & 1\\ 1 &-2 & 0\\ 2 & 0 &-1 \end{pmatrix} \end{equation*}

请同学们自行验证

\begin{equation*} P^{-1}AP = \begin{pmatrix} 9 & 0 & 0\\ 0 &-9 & 0\\ 0 & 0 &-9 \end{pmatrix}\triangleq B. \end{equation*}

上式可以被改写为\(A = PBP^{-1}\)，于是

\begin{equation*} A^{10} = PB^{10}P^{-1}= 9^{10}E. \end{equation*}
计算特征多项式可知\(\chi_A(\lambda)= \lambda^2+4 \)，可知\(A\)矩阵没有实特征值，所以\(A\)在实数域\(\R\)上不可对角化。

当在复数域\(\C\)上讨论问题时，\(A\)矩阵有两个不同特征值\(2i\)和\(-2i\)，所以\(A\)可对角化。题目的剩余部分留给读者。
计算特征多项式可知\(\chi_A(\lambda)= (\lambda-1)(\lambda-2)^2\)。考虑特征值\(\lambda_2 = 2\)，其代数重数为2，简单计算可知\(r(2E-A) =2\)，所以\(\lambda_2\)的几何重数为1，严格小于代数重数，所以\(A\)不可对角化。

无论在理论问题还是在实际问题中，将方阵\(A\)带入多项式获得 \(f(A)\) 是常见操作。若\(f(x)\)次数较高，直接按照多项式表达式和矩阵乘法公式计算\(f(A)\)会因为运算次数过多而几乎无法完成。当\(A\)可对角化时，利用相似变换，\(f(A)\)可以用相对少很多的运算次数计算得出，见下面的例子。

例 7.4.10.

取\(A=\begin{pmatrix} -1 & 4 & 8 \\ 4 & -7 & 4 \\ 8 & 4 & -1\end{pmatrix}\)，

求\(A^n\)；
设\(f(x)\)是一个多项式，求\(f(A)\)。

解答.

由例 7.4.9可知

\begin{equation*} A= \begin{pmatrix} 2 & 1 & 1\\ 1 &-2 & 0\\ 2 & 0 &-1 \end{pmatrix} \begin{pmatrix} 9 & 0 & 0\\ 0 &-9 & 0\\ 0 & 0 &-9 \end{pmatrix} \begin{pmatrix} 2 & 1 & 1\\ 1 &-2 & 0\\ 2 & 0 &-1 \end{pmatrix}^{-1}, \end{equation*}

于是

\begin{equation*} A^n= \begin{pmatrix} 2 & 1 & 1\\ 1 &-2 & 0\\ 2 & 0 &-1 \end{pmatrix} \begin{pmatrix} 9^n & 0 & 0\\ 0 &(-9)^n & 0\\ 0 & 0 &(-9)^n \end{pmatrix} \begin{pmatrix} 2 & 1 & 1\\ 1 &-2 & 0\\ 2 & 0 &-1 \end{pmatrix}^{-1}. \end{equation*}

对于更一般的多项式\(f(x)\)，可知

\begin{equation*} f(A)= \begin{pmatrix} 2 & 1 & 1\\ 1 &-2 & 0\\ 2 & 0 &-1 \end{pmatrix} \begin{pmatrix} f(9) & 0 & 0\\ 0 &f(-9) & 0\\ 0 & 0 &f(-9) \end{pmatrix} \begin{pmatrix} 2 & 1 & 1\\ 1 &-2 & 0\\ 2 & 0 &-1 \end{pmatrix}^{-1}. \end{equation*}

子节 7.4.2 线性变换的可对角化

接下来，我们把矩阵语言叙述的定义和结论翻译为变换语言。

定义 7.4.11.

设\(\varphi\)是数域\(\mathbb{F}\)上\(n\)维空间\(V\)的线性变换。若存在\(V\) 的一个基，使得\(\varphi\)在此基下的矩阵是对角矩阵，则称\(\varphi\)是可对角化的。

此时，对角元素恰为\(\varphi\)的特征值，而相应的基向量恰为该特征值的特征向量。

定义 7.4.12.

设\(\varphi\)是数域\(\mathbb{F}\)上\(n\)维空间\(V\)的线性变换，\(\lambda_0\)是\(\varphi\)的一个特征值。\(\lambda_0\)作为特征多项式\(\chi_{\varphi}(\lambda)\)的根的重数\(n_0\)称为\(\lambda_0\)的代数重数，\(\lambda_0\)的特征子空间的维数称为\(\lambda_0\)的几何重数。

定理 7.4.13.

设\(\varphi\)是数域\(\mathbb{F}\)上\(n\)维线性空间\(V\)的线性变换，则下列命题等价：

\(\varphi\)在\(\mathbb{F}\)上可对角化；
\(\varphi\)在\(\mathbb{F}\)上有\(n\)个线性无关的特征向量；
\(\varphi\)的特征多项式所有根都在\(\mathbb{F}\)上，并且所有特征值的代数重数等于几何重数。

推论 7.4.14.

若数域\(\mathbb{F}\)上\(n\)维线性空间\(V\)的线性变换\(\varphi\)有\(n\)个不同的特征值，则\(\varphi\)可对角化。

子节 7.4.3 可对角化矩阵（变换）的几何理解

本小节中，我们从空间变换的角度来理解可对角化矩阵作为列向量空间上线性变换的几何意义。

定理 7.4.15.

设\(A\)是\(n\)阶方阵，\(\lambda_1,\ldots,\lambda_t \)是\(A\)的所有不同特征值，\(V_{\lambda_i}(i=1,\ldots,t)\)是特征值\(\lambda_i\)的特征子空间。则方阵\(A\)可对角化的充分必要条件是

\begin{equation} \F^{n} = V_{\lambda_1}\oplus\cdots \oplus V_{\lambda_k}.\tag{7.4.2} \end{equation}

证明.

此定理是定理 7.4.6的一部分。

我们尝试从几何角度理解可对角化的\(A\)作为线性变换的作用效果：(7.4.2)决定了空间的分解方式，进而对\(\forall \alpha\in \F^n\)， \(\alpha\)可以唯一分解为

\begin{equation*} \alpha= \sum_{i=1}^t \alpha_i,\ \alpha_i\in V_{\lambda_i}(i=1,\ldots,t) \end{equation*}

于是

\begin{equation*} A\alpha = \sum_{i=1}^t A\alpha_i = \sum_{i=1}^t \lambda_i \alpha_i, \end{equation*}

即\(A\)的作用效果相当于对其特征子空间进行不同的伸缩（伸缩比例为相应特征值），然后再利用加法合成变换后的向量。

设\(P^{-1}AP = \begin{pmatrix} \lambda_1 & &\\ & \ddots &\\ & & \lambda_n \end{pmatrix}\triangleq B\)，\(P = (\xi_1,\dots,\xi_n)\)是由\(A\)的线性无关特征向量组拼成的矩阵，同时也是全空间的基变换矩阵。这个等式也可被改写为\(A = PBP^{-1}\)。

对任意给定的一个向量\(\alpha=(a_1,\ldots,a_n)\in \F^n\)，\(\alpha\)也可以是它标准基\((\varepsilon_1,\dots,\varepsilon_n)\)下的坐标向量。我们可以想象按照下面3个步骤来获得\(\alpha\)的像\(A\alpha\)：

\(\alpha\)左乘矩阵\(P^{-1}\)，记\(\beta = P^{-1}\alpha\triangleq (b_1,\dots,b_n)^T \)，则\(\beta\)是向量\(\alpha\)在基\((\xi_1,\dots,\xi_n)\)下的坐标向量。这一步也可理解为获得了\(\alpha\)在特征向量组方向上分解：

\begin{equation*} \alpha = b_1\xi_1+\cdots+b_n\xi_n=P\beta; \end{equation*}
\(\beta\)左乘矩阵\(B\)（等同于对向量\(\alpha\)作线性变换\(A\)），获得变换后的像\(A\alpha\)在基\((\xi_1,\dots,\xi_n)\)下的坐标为 \(B\beta = (\lambda_1b_1,\ldots,\lambda_nb_n)^T\)，\(B\)的作用效果就是在每一个特征向量\(\xi_i(i=1,\dots,n )\)的方向上做数乘变换。注意到矩阵\(B\)和矩阵\(A\)是同一个线性变换在不同基下的表示矩阵，所以

\begin{equation*} A\alpha = \lambda_1b_1\xi_1+\cdots+\lambda_n b_n\xi_n; \end{equation*}
\(B\beta\)左乘矩阵\(P\)，还原向量\(A\alpha\)为其标准基下的坐标，即

\begin{equation*} A\alpha =(\xi_1,\dots,\xi_n)\begin{pmatrix} \lambda_1 b_1\\\vdots\\\lambda_n b_n \end{pmatrix}= PB\beta = PBP^{-1}\alpha. \end{equation*}

下面以2阶方阵

\begin{equation*} A = \begin{pmatrix} 1 & \frac{1}{2} \\ 0 & 1 \end{pmatrix}\begin{pmatrix} 2 & 0\\ 0 & -1 \end{pmatrix}\begin{pmatrix} 1 & \frac{1}{2} \\ 0 & 1 \end{pmatrix}^{-1} = \begin{pmatrix} 2 & -\frac{3}{2} \\ 0 & -1 \end{pmatrix} \end{equation*}

和\(\alpha = (3,2)^T\)为例说明上述过程。

我们先把\(\alpha\)画在xoy平面上，并借助标准网格具像化以标准基\(\varepsilon_1 = (1,0)^T\)、\(\varepsilon_2= (0,1)^T\)为基的2维线性空间。

保持向量\(\alpha\)不变，将空间的基替换为两个特征向量\(\xi_1=(1,0)^T\)、\(\xi_2=(1/2,1)^T\)，同时更换网格。

借助网格可知\(\alpha\)在两个特征子空间上被分解为

\begin{equation*} \alpha = 2\xi_1 +2\xi_2 \triangleq \alpha_1+\alpha_2, \end{equation*}

也就是\(\alpha\)在基\((\xi_1,\xi_2)\)下的坐标为\((2,2)^T\)，这与利用代数方法计算\(P^{-1}\alpha\)结果相同。

对空间做\(B\)矩阵(同时也是\(A\)矩阵)相应的线性变换：沿\(\xi_1\)方向拉伸为原来的2倍（因为\(\xi_1\)对应的特征值为2），沿\(\xi_2\)方向变为原来的反向（因为\(\xi_1\)对应的特征值为\(-1\)）。所得向量如下图所示。

保持向量\(\alpha\)和\(A\alpha\)，将空间的基还原为标准基可得下图。

下面来看空间中多个点在线性变换前后的相对位置关系，从而理解线性变换对空间的整体作用效果。在原始空间的一个圆上选取100个点，用不同的颜色来区分不同的点。下面两张图中同色点对应的是线性变换前后的相同点。

为进一步理解矩阵\(A\)作为线性变换的作用效果，下图中将标准网格替换为特征向量对应的网格。记

\begin{equation*} A_1= P\begin{pmatrix} 1 & 0\\ 0& -1 \end{pmatrix} P^{-1},\quad A_2= P\begin{pmatrix} 2 & 0\\ 0& 1 \end{pmatrix} P^{-1}. \end{equation*}

矩阵\(A\)的作用效果可以分解为先作用\(A_1\)，然后再作用\(A_2\) （图(a)\(\rightarrow\)(c)\(\rightarrow\)(b) ）；也可以分解为先作用\(A_2\)，然后再作用\(A_1\)（图(a)\(\rightarrow\)(d)\(\rightarrow\)(b) ）。作用后的图像如下所示。

基变换可以认为是改变了对空间的“测量标准”，在不同的测量标准下，线性变换（或矩阵乘法）规律的明显程度不同。采用线性无关的特征向量组作为基（测量标准），线性变换的规律性非常明显，即可对角化线性变换本质上都可以转化为不同方向上的数乘变换来进行理解。

练习 7.4.4 练习

基础题.

1.

判断矩阵\(A\)是否可对角化。若可对角化，求可逆矩阵\(P\)，使得\(P^{-1}AP\)是对角矩阵，并求\(A^n\)。

(1) \(A=\begin{pmatrix} 2&2&-2\\2&5&-4\\-2&-4&5 \end{pmatrix}\)； (2) \(A=\begin{pmatrix} 0&1&1\\0&0&1\\0&0&0 \end{pmatrix}\text{.}\)

2.

已知\(A\)与\(B\)相似，其中

\begin{equation*} A=\begin{pmatrix} 1&-1&1\\2&4&-2\\-3&-3&5 \end{pmatrix},\ B=\begin{pmatrix} 2&0&0\\0&2&0\\0&0&a \end{pmatrix}. \end{equation*}

求\(a\)的值；
求满足\(P^{-1}AP=B\)的可逆矩阵\(P\)。

提高题.

3.

设\(A\)是\(n\)阶矩阵，\(X_1,X_2,\cdots ,X_n\in\mathbb{F}^n\)，且\(X_n\neq 0\)。若

\begin{equation*} AX_1=X_2,\ AX_2=X_3,\ \cdots ,\ AX_{n-1}=X_n,\ AX_n=0. \end{equation*}

证明：\(X_1,X_2,\cdots ,X_n\)线性无关；
求\(A\)的特征值和特征向量；
问\(A\)是否可对角化。

4.

设\(\alpha =(a_1,a_2,\cdots ,a_n)^T, \beta =(b_1,b_2,\cdots ,b_n)^T\in\mathbb{R}^n\)，且\(\alpha\neq 0, \beta\neq 0, n>1\)。令\(A=\beta \alpha^T\)。试问：\(A\)是否可对角化？如果\(A\)可对角化，求出一个可逆矩阵\(P\)，使得\(P^{-1}AP\)为对角阵，并且写出这个对角矩阵。

5.

设\(A=(a_{ij})\)是数域\(\mathbb{F}\)上的\(n\)阶上三角矩阵，证明：

若\(a_{11},a_{22},\cdots ,a_{nn}\)互不相等，则\(A\)可对角化；
若\(a_{11}=a_{22}=\cdots =a_{nn}\)，且至少存在一个\(a_{kl}\neq 0 (k<l)\)，则\(A\)不可对角化。

6.

若\(n\)阶方阵\(A\)满足\(A^2=A\)，证明： (1)\(A\)可对角化；(2)\(r(A)= tr (A)\)。

7.

设\(A\)是数域\(\mathbb{F}\)上秩为\(r\)的\(n\)阶方阵，

证明：\(A^2=A\)的充分必要条件是存在\(r\times n\)行满秩矩阵\(B\)及\(n\times r\)列满秩矩阵 \(C\)，使得\(A=CB\)且\(E_r=BC\)；
当\(A^2=A\)时，证明：\(\det (2E-A)=2^{n-r},\ \det (A+E)=2^r\)。

8.

若实矩阵\(A\)满足\(A^2-A+2E=0\)，证明：\(A\)在实数域上不可对角化。

9.

设数域\(\mathbb{F}\)上\(n\)阶方阵\(A,\ B\)满足\(AB=BA\)，且\(A\)有\(n\)个不同的特征值，证明：\(B\)可对角化。

10.

设\(\varphi\)是数域\(\mathbb{F}\)上\(n\)维线性空间\(V\)的线性变换，证明下列命题是等价的：

\(\varphi\)可对角化；
\(V=V_{\lambda_1}\oplus V_{\lambda_2}\oplus\cdots\oplus V_{\lambda_t}\)，这里\(\lambda_1,\lambda_2,\cdots ,\lambda_t\)是\(\varphi\)的全部互异特征值；
\(\sum\limits_{i=1}^t\dim V_{\lambda_i}=n\)，这里\(\lambda_1,\lambda_2,\cdots ,\lambda_t\)是\(\varphi\)的全部互异特征值。

11.

设\(\varphi\)是数域\(\mathbb{F}\)上\(n\)维线性空间\(V\)的线性变换，且满足\(\varphi^2+\varphi=2 {\rm id}_V\)。

证明： (1)\(\varphi\)的特征值是\(1\)和\(-2\)；(2)\(V=V_{1}\oplus V_{-2}\)。

挑战题.

12.

向前 Top 向后