特征值与特征向量

节 7.3 特征值与特征向量

上一节中，我们看到一些线性变换可以限制在其不变子空间上，从而获得一个相对简单的变换。本节中，我们将进一步考虑限制变换是最简单的变换，即数乘变换这一特殊情况。

用\(V\)表示一个数域\(\F\)（本章中，\(\F\)通常代表\(\R\)或\(\C\)）上的\(n\)维空间，\(\phi\)表示\(V\)上一个一般线性变换。在选定\(V\)的一个基\((\xi_1,\dots,\xi_n)\)后，利用同构的思想，\(V\)可以等同于\(\F^n\)，\(V\)中的向量可以等同于\(\F^n\)中的\(n\)维列向量；相应地，\(\phi\)可以等同于它的表示矩阵\(A\)。

相对于线性变换，方阵给我们的感觉更为具体和容易掌握。接下来我们会首先针对方阵给出线性代数的一些最重要概念。根据同构的思想，方阵和有限维空间上的线性变换本质上是一样的，因此在方阵上定义的这些重要概念也可以平行定义给线性变换。这些概念对理解线性变换和方阵的性质至关重要。

子节 7.3.1 矩阵特征值与特征向量的定义

数乘变换是最简单的线性变换，此时数乘变换所乘的数可以决定这个线性变换。对于一般的线性变换/方阵，我们引入如下的重要概念。

定义 7.3.1.

设\(A\)是数域\(\mathbb{F}\)上\(n\)阶方阵。若存在\(\lambda\in\mathbb{F},{\color{red}{0\neq}}v\in\mathbb{F}^n\)，使得

\begin{equation} Av=\lambda v,\tag{7.3.1} \end{equation}

则称\(\lambda\)是\(A\)的一个特征值，\(v\)是\(A\)属于特征值\(\lambda\)的一个特征向量。

由定义可知：对于数乘变换的表示矩阵即数量矩阵\(cE_n\)，其特征值就是\(c\)，此时\(\F^n\)中所有非0向量都是\(c\)的特征向量。

上述定义中的要求特征向量\(v\ne 0\)非常重要，因为如果没有这个限制，允许\(v=0\)，则此时对于任意的\(\lambda\)，\(A0=\lambda 0\)均成立，这样就失去了定义特征值的意义。

将 (7.3.1)稍微改写，可得

\begin{equation} (A-\lambda E_n)v=0\tag{7.3.2} \end{equation}

把这个方程看成是以\(A-\lambda E_n\)为系数矩阵的齐次线性方程组，则特征向量\(v\)是这个线性方程组的非0解。根据齐次线性方程组有非0解的充分必要条件，可知此时\(A-\lambda E_n\)的行列式必定为0。

定义 7.3.2.

\begin{equation*} \det (\lambda E_n-A)=\left|\begin{array}{cccc} \lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\ddots& \vdots\\ \vdots&\ddots&\ddots&-a_{n-1,n}\\ -a_{n1}&\cdots &-a_{n,n-1} &\lambda-a_{nn} \end{array}\right| \end{equation*}

称为方阵\(A\)的特征多项式，记为\(\chi_A(\lambda)\)。

根据定义，可知下面的结论成立。

定理 7.3.3.

设\(A\)是数域\(\mathbb{F}\)上的\(n\)阶方阵，则

\(\lambda_0\)是\(A\)的特征值当且仅当\(\lambda_0\)是\(A\)的特征多项式\(\chi_A(\lambda)\)在\(\mathbb{F}\)中的根。
\(v_0\)是\(A\)属于特征值\(\lambda_0\)的特征向量当且仅当\(v_0\)是齐次线性方程组\((\lambda_0E-A)x=0\)的一个非零解。

注意到齐次线性方程组的解集都是子空间，我们有下面的结论。

定理 7.3.4.

设\(\lambda\)是\(A\)的一个特征值，则

\begin{equation*} V^{(A)}_{\lambda}=\{v \in\mathbb{F}^n|\ Av=\lambda v\} \end{equation*}

是\(\mathbb{F}^n\)的子空间，且是线性变换\(A\)的不变子空间。

证明.

\(V^{(A)}_{\lambda}\)是线性方程组\((\lambda E-A)x=0\)的解集，故是子空间。

另一方面，对于任意的\(v\in V^{(A)}_{\lambda}\)，有\(Av=\lambda v \in V^{(A)}_{\lambda}\)，故\(V^{(A)}_{\lambda}\)是线性变换\(A\)的不变子空间。

定理 7.3.4 中的\(V^{(A)}_{\lambda}\)称为\(A\)属于特征值\(\lambda\)的特征子空间。在没有歧义的前提下，\(V^{(A)}_{\lambda}\)也常被简记为\(V_{\lambda}\)。可知特征子空间中的任意非0向量都是\(\lambda\)的特征向量，\(\lambda\)的特征向量也都落在相应特征子空间中。

接下来通过几个例子来进一步熟悉上面的一些定义。

例 7.3.5.

设

\begin{equation*} A = \begin{pmatrix} 3 & 2 & 4\\ 2 & 0 & 2\\ 4 & 2 & 3 \end{pmatrix}, \end{equation*}

求矩阵\(A\)的所有特征值和特征子空间。

解答.

简单计算可知，\(A\)的特征多项式为

\begin{equation*} \chi_A(\lambda)=\lambda^3-6\lambda^2-15\lambda-8=(\lambda-8)(\lambda+1)^2, \end{equation*}

故特征值为\(\lambda=-1\)（重数为2）和\(\lambda=8\)（重数为1）。

下面分别求特征值\(\lambda=-1\)和\(\lambda=8\)对应的特征向量。

对于特征值\(\lambda=-1\)，解线性方程组\((-E-A)x=0\)（或\((A+E)x=0\)），得到基础解系

\begin{equation*} v_1=(1,0,-1)^T,\quad v_2= (0,1,-\frac{1}{2}), \end{equation*}

故特征子空间

\begin{equation*} V_{-1}=\langle (1,0,-1)^T, (0,1,-\frac{1}{2})^T\rangle=\left\{ c_1v_1+c_2v_2|c_1,c_2\in\F\right\}. \end{equation*}
对于特征值\(\lambda=8\)，解线性方程组\((8E-A)x=0\)，得到基础解系

\begin{equation*} v_3=(2,1,2)^T, \end{equation*}

故特征子空间

\begin{equation*} V_{8}=\langle (2,1,2)^T\rangle=\left\{ c_3v_3|c_3\in\F\right\}. \end{equation*}

特征值的英文名称为eigenvalue，其前缀“eigen”来自德语，本意为“自身的”，也可理解为“表征一种内在属性的”，因此也有一些学者将eigenvalue翻译为“本征值”。

在sage中，与特征值、特征多项式、特征向量相关的命令有如下几个：

三角型矩阵的特征值和特征多项式都很好求。

例 7.3.6. 上三角矩阵的特征值.

设\(A = \begin{pmatrix} \lambda_1 & & *\\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix}\)，求矩阵\(A\)的所有特征值。

解答.

根据定义和行列式的性质可知：

\begin{equation*} \chi_A(\lambda)=\det (\lambda E_n-A)=(\lambda-\lambda_1)\cdots (\lambda-\lambda_n), \end{equation*}

故全部特征值为\(\lambda_1,\dots,\lambda_n\)。

结合上面的例题，我们有一个常用的结论。

命题 7.3.7.

上（下）三角矩阵的全部特征值是恰好是其所有对角线元素，即\(\lambda\)是上（下）三角矩阵\(A\)的一个特征值当且仅当\(\lambda\)是\(A\)的一个对角元。

下一个例子说明在讨论特征值相关问题时，最好在复数域上进行。

例 7.3.8.

分别求矩阵\(A = \begin{pmatrix} 0 & 1\\ -1 & 0 \end{pmatrix}\)在实数域和复数域上的特征值和特征向量。

解答.

计算可得\(A\)的特征多项式为

\begin{equation*} \chi_A(\lambda)=\lambda^2+1=(\lambda+i)(\lambda-i), \end{equation*}

故在复数域上，\(A\)的特征值为\(\lambda=i,-i\)，对应的特征向量分别为

\begin{equation*} c_1(1,i)^T,c_2(1,-i)^T, \quad c_1\ne0,c_2\ne 0. \end{equation*}

在实数域上，\(A\)没有特征值，相应地也没有特征向量。

子节 7.3.2 特征值、特征向量的常用性质

我们先从特征多项式根的角度着手理解特征值性质。任意数域上多项式的根都可能是复数根（如例 7.3.8 所示），所以讨论特征值相关问题时通常默认是放在复数域范围内讨论。另一方面，很多工程问题天然局限在实数域范围内，所以有时我们也讨论实数域下特征值、特征向量的相关问题。

下面是关于特征多项式的常用结论。

命题 7.3.9.

设\(A\)是\(n\)阶方阵，则\(A\)的特征多项式\(\chi_A(\lambda)\)是一个\(n\)次首一多项式。若\(A\)是实方阵，则\(\chi_A(\lambda)\)是实系数多项式；若\(A\)是复方阵，则\(\chi_A(\lambda)\)是复系数多项式。

证明.

注意到

\begin{equation*} \chi_A(\lambda) = \begin{vmatrix} \lambda-a_{11} & -a_{12} &\cdots & -a_{1n}\\ -a_{21} & \lambda-a_{22} & \ddots & \vdots\\ \vdots & \ddots & \ddots & -a_{n-1,n}\\ -a_{n1} & \cdots & a_{n,n-1} & \lambda-a_{nn} \end{vmatrix}, \end{equation*}

利用行列式的展开式定义定义 3.1.10可知结论成立。

定理 7.3.10.

设\(A\)是\(n\)阶方阵, 记

\begin{equation*} \chi_A(\lambda)=\det (\lambda E_n-A)=\lambda^n-a_{n-1}\lambda^{n-1}+\cdots +(-1)^na_0, \end{equation*}

则

\begin{equation*} a_{n-1}={\rm tr} (A),\ a_0=\det A. \end{equation*}

证明.

按照行列式的展开式定义，\(\chi_A(\lambda)\)中唯一可以产生\(\lambda^{n-1}\)的\(n\)项乘积是所有对角元乘积，也就是说\(\chi_A(\lambda)\)与多项式

\begin{equation*} f(\lambda)=(\lambda-a_{11})\cdots(\lambda-a_{nn}) \end{equation*}

具有相同的\(n-1\)次方项系数。将\(f(\lambda)\)展开后可知其\(n-1\)次方项系数为

\begin{equation*} -a_{11}-\cdots -a_{nn} = -{\rm tr}(A), \end{equation*}

即\(a_{n-1}={\rm tr} (A)\)。
注意到

\begin{equation*} (-1)^n a_0 =\chi_A(0)= \det (-A) =(-1)^n \det A, \end{equation*}

所以\(a_0=\det A\)。

根据Viète定理（定理 1.6.10 ），可得下述推论。

推论 7.3.11.

若\(\lambda_1,\cdots ,\lambda_n\)是\(n\)阶方阵\(A\)的全部特征值, 则

\begin{equation*} \det A=\lambda_1 \cdots \lambda_n,\ {\rm tr} (A)=\lambda_1+\cdots +\lambda_n. \end{equation*}

推论 7.3.12.

设\(A\)是\(n\)阶方阵，则\(A\)是可逆的充分必要条件是\(A\)的特征值全不为零。

在讲解矩阵乘法时，我们强调了一般情况下两个矩阵的乘积\(AB\)与\(BA\)（假设都存在）通常不相等。虽然不相等，但可以想象这两个矩阵存在一些联系。下面的例子从特征值角度揭示了这两个积矩阵的内在联系。

例 7.3.13. \(AB\)与\(BA\)的特征值.

设\(A\in\mathbb{F}^{m\times n},B\in\mathbb{F}^{n\times m}\)且\(m\geq n\)。证明：

\(\chi_{AB}(\lambda)=\lambda^{m-n}\chi_{BA}(\lambda)\)；
\({\rm tr} (AB)={\rm tr} (BA)\)；
当\(A,\ B\)均为\(n\)阶方阵时，\(\chi_{AB}(\lambda)=\chi_{BA}(\lambda)\)。

解答.

注意到 \(\chi_{AB}(\lambda) = \det (\lambda E_m-AB)\)，\(\chi_{BA}(\lambda) = \det (\lambda E_n-BA)\)，所以这个结论是定理 3.3.24的直接推论。
第一部分的结论说明，矩阵\(BA\)的特征值集合只是比矩阵\(AB\)特征值集合少了\(m-n\)个0，结合推论 7.3.11可知结论成立。
特取\(m =n\)，可知结论成立。

上述例子说明：\(AB\)与\(BA\)的非0特征值集合（按重数记的多重集）必定相同。

我们再来看一下转置运算对特征值的影响。

定理 7.3.14.

设\(A\)是\(n\)阶方阵，则

\begin{equation*} \chi_A(\lambda)=\chi_{A^T}(\lambda). \end{equation*}

即\(A\)与\(A\)的转置\(A^T\)有相同的特征值。

接下来讨论特征向量的常用基本性质。

定理 7.3.15.

设\(A\)是\(n\)阶方阵，则\(A\)属于不同特征值的特征向量线性无关。

证明.

设\(\lambda_1,\dots,\lambda_t\)是\(A\)的两两不同特征值，\(v_1,\dots,v_t\)是对应的特征向量，即

\begin{equation*} Av_j=\lambda_j v_j,\quad j=1,\dots,t. \end{equation*}

下面证明\(v_1,\dots,v_t\)线性无关。

对\(t\)使用归纳法。当\(t=1\)时，由于特征向量都不是0向量，所以显然线性无关。

对一般的\(t\)，设

\begin{equation} a_1v_1+\dots +a_tv_t =0,\tag{7.3.3} \end{equation}

等式两边同时左乘\(A\)后化简得

\begin{equation} a_1\lambda_1 v_1+\dots+ a_t\lambda_t v_t =0,\tag{7.3.4} \end{equation}

用\(\lambda_t\)乘以(7.3.3)然后减去 (7.3.4)得

\begin{equation*} a_1(\lambda_t-\lambda_1)v_1+\cdots +a_{t-1}(\lambda_t-\lambda_{t-1})v_{t-1}=0. \end{equation*}

根据归纳假设，\(v_1,\dots,v_{t-1}\)线性无关，所以

\begin{equation*} a_1(\lambda_t-\lambda_1)=\cdots = a_{t-1}(\lambda_t-\lambda_{t-1})= 0. \end{equation*}

注意到\(\lambda_1,\dots,\lambda_t\)两两不同，所以\(a_1 = \dots = a_{t-1}=0\)。将之代入(7.3.3)，并结合\(v_t\ne 0\)，可知\(a_t = 0\)，即(7.3.3)中所有的线性组合系数均为0，于是\(v_1,\dots,v_{t}\)线性无关，结论成立。

推论 7.3.16.

设\(n\)阶方阵\(A\)的不同特征值为\(\lambda_1,\dots ,\lambda_t\)，齐次线性方程组\((\lambda_iE-A)x=0\)的基础解系为\(\eta_{i1},\dots,\eta_{is_i},(i=1,\dots ,t)\)，则向量组

\begin{equation*} \eta_{11},\dots,\eta_{1s_1},\eta_{21},\dots,\eta_{2s_2},\dots,\eta_{t1},\dots,\eta_{ts_t} \end{equation*}

线性无关，即\(V_{\lambda_1}+\cdots +V_{\lambda_t}\)是直和。

证明.

设

\begin{equation} a_{11}\eta_{11}+\cdots a_{1s_1}\eta_{1s_1} +\cdot + a_{t1}\eta_{t1}+\cdots a_{ts_t}\eta_{ts_t} =0,\tag{7.3.5} \end{equation}

下面证明这些组合系数都是0。

记\(v_i =a_{i1}\eta_{i1}+\cdots+ a_{is_i}\eta_{is_i}\)，则\(v_i\in V_{\lambda_i}\)，即当\(v_i\ne 0\)时，\(v_i\)是特征值\(\lambda_i\)的特征向量。将(7.3.5)用\(v_i\)改写后可得

\begin{equation} v_1+\cdots + v_t =0.\tag{7.3.6} \end{equation}

若\(v_1,\dots,v_t\)中存在不为0的向量，去掉其它0向量后，(7.3.6)是属于不同特征值的特征向量系数全为1的线性组合等于0向量，与定理 7.3.15矛盾。所以\(v_1,\dots,v_t\)均为0向量。

对每一个\(i=1,\dots,t\)，\(a_{i1}\eta_{i1}+\cdots+ a_{is_i}\eta_{is_i} = v_i=0\)，而\(\eta_{i1},\dots,\eta_{is_i}\)是基础解系，所以

\begin{equation*} a_{i1}=\cdots=a_{is_i}=0 \end{equation*}

对所有的\(i\)成立。命题成立。

子节 7.3.3 线性变换的特征值与特征向量

根据同构的思想，\(\mathcal{L}(V)\)与\(\F^{n\times n}\)同构（\(V\)是数域\(\F\)上的\(n\)维线性空间），于是在给定基的前提下每一个线性变换都可以等同于一个方阵。下面，我们特别针对线性变换给出特征值的相关定义，并说明这些定义与针对矩阵给出的定义在逻辑上是自洽的。

定义 7.3.17.

设\(\varphi\)是数域\(\mathbb{F}\)上\(n\)维线性空间\(V\)的线性变换。若存在\(\lambda\in\mathbb{F}\)，\({\color{blue}{0\neq }}\alpha\in V\)，使得

\begin{equation*} \varphi (\alpha)=\lambda\alpha , \end{equation*}

则称\(\lambda\)是线性变换\(\varphi\)的一个特征值，\(\alpha\)为\(\varphi\)的属于特征值\(\lambda\)的特征向量。将

\begin{equation*} V_{\lambda}= V^{(\varphi)}_{\lambda}=\{\alpha\in V|\ \varphi (\alpha)=\lambda\alpha\} \end{equation*}

称为\(\varphi\)的属于特征值\(\lambda\)的特征子空间。

相对于矩阵，线性变换的好处在于线性变换定义了限制变换。类似于定理 7.3.4，可知\(V_{\lambda_0}\)是\(\varphi\)-子空间，且\(\varphi\)在\(V_{\lambda_0}\)上的限制变换\(\varphi|_{V_{\lambda_0}}\)就是一个数量变换，即是一个伸缩变换，伸缩比就是特征值 \(\lambda_0\)。

同一个线性变换在不同基下的表示矩阵可以是不同的。当我们利用同构思想，将一个线性变换转化矩阵时，不同基下对应的矩阵是否可能有不同的特征值呢？答案是不可能。注意到同一个线性变换在不同基下表示矩阵是相似的，下面的定理解释了为什么不可能。

定理 7.3.18.

设\(A,\ B\)是数域\(\mathbb{F}\)上的\(n\)阶方阵。若\(A\)相似于\(B\)，则

\begin{equation*} \chi_A(\lambda)=\chi_{B}(\lambda), \end{equation*}

即相似矩阵有相同的特征值。

上述结论说明了矩阵特征值与线性变换特征值的定义在逻辑上没有矛盾，即将其用相同的名称特征值是合理的。这个性质也可叙述为：特征值/特征多项式在相似变换下保持不变。

定义 7.3.19.

设\(\varphi\)是\(\mathbb{F}\)上\(n\)维线性空间\(V \)的线性变换，\(\varphi\)在\(V\)的基\((\xi_1,\dots ,\xi_n)\)下的矩阵为\(A\)，\(\chi_A(\lambda)\)是\(A\)的特征多项式。称\(\chi_A(\lambda)\)为\(\varphi\)的特征多项式，记为\(\chi_{\varphi}(\lambda)\)。

从逻辑上讲，\(\varphi\)的特征多项式\(\chi_{\varphi}(\lambda)\)应该由\(\varphi\)完全确定。定理 7.3.18保证了在定义 7.3.19中特征多项式的结果与基\((\xi_1,\dots ,\xi_n)\)的选择无关，即定义 7.3.19在逻辑上是自洽的。

子节 7.3.4 矩阵的上三角化

在例 7.3.6中，上三角矩阵的特征值就是它的所有对角元。接下来我们说明：在复数域上，任意方阵都可以经相似变换变成上三角矩阵。

定理 7.3.20.

设 \(A\in \C^{n\times n}\)，则存在可逆矩阵\(P\in \C^{n\times n}\)，使得 \(P^{-1}AP\)是上三角矩阵，且此时\(P^{-1}AP\)的所有主对角线上元素恰好就是 \(A\) 的所有特征值。

证明.

取\(\lambda_1\)是特征多项式\(\chi_A(\lambda)\)的一个根，代数学基本定理（定理 1.6.1）确保了\(\lambda_1\)的存在性。

取\(\xi_1\)是\(\lambda_1\)的一个特征向量。将\(\xi_1\)扩充为\(\C^n\)的一个基：\((\xi_1,\dots,\xi_n)\)，把基中的向量按列拼成一个矩阵，记\(P_1=(\xi_1,\dots,\xi_n)\)，则\(P_1\)是一个可逆矩阵。

根据定义可知

\begin{equation*} A(\xi_1,\dots,\xi_n) = (\xi_1,\dots,\xi_n) \begin{pmatrix} \lambda_1 & * & \cdots & * \\ 0 & * & \cdots & * \\ \vdots & \vdots &\ddots &\vdots\\ 0 & * & \cdots & * \end{pmatrix}. \end{equation*}

将上式最右端矩阵删除第一行、第一列后获得的\(n-1\)阶子方阵记为\(A_1\)，上式可以改写为

\begin{equation} P_1^{-1}AP_1 = \begin{pmatrix} \lambda_1 & *\\ 0 & A_1 \end{pmatrix}\tag{7.3.7} \end{equation}

对矩阵阶数\(n\)使用归纳法。根据归纳假设，存在一个\(n-1\)阶可逆矩阵，记为\(Q\)，使得\(Q^{-1}A_1Q\)是一个上三角阵，不妨记

\begin{equation*} Q^{-1}A_1Q = \begin{pmatrix} \lambda_2 & & *\\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix} \end{equation*}

取\(P_2= \begin{pmatrix} 1 & 0\\ 0 & Q \end{pmatrix} \)，则\(P_2\)是\(n\)阶可逆方阵。取\(P= P_1P_2\)，则\(P\)也是\(n\)阶可逆方阵。简单计算可知

\begin{equation*} P^{-1}AP = \begin{pmatrix} \lambda_1 & *\\ 0 & Q^{-1}A_1Q \end{pmatrix} = \begin{pmatrix} \lambda_1 & & * \\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix} \end{equation*}

结论成立。

一般数域\(\mathbb{F}\)上的方阵\(A\)未必相似于\(\mathbb{F}\)上的上三角矩阵，主要原因是因为特征值可能会不落在\(\mathbb{F}\)内。事实上，若\(A\)特征值全在\(\mathbb{F}\)中，则在\(\mathbb{F}\)上\(A\)也可以相似于上三角矩阵。

推论 7.3.21.

设 \(A\in \F^{n\times n}\)。若\(A\)的所有特征值均属于\(\mathbb{F}\)，则存在可逆矩阵\(P\in \F^{n\times n}\)，使得 \(P^{-1}AP\)是上三角矩阵，且此时\(P^{-1}AP\)的所有主对角线上元素就是 \(A\) 的所有特征值。

特别的，若实方阵\(A\)的特征值都是实数，则\(A\)实相似于上实上三角矩阵。

证明.

在定理 7.3.20的证明中，当\(\lambda_1\in \F\)时，我们可以选取\(\xi_1\in \F^n\)，且在\(\F^n\)内进行扩基，这样可以保证\(P\in \F^{n\times n}\)。

上三角矩阵带入多项式后有明显规律，这种规律可以用下面的结论描述。

命题 7.3.22.

设\(A\)是数域\(\mathbb{F}\)上的\(n\)阶方阵，\(f(x)\in\mathbb{F} [x]\)，证明：

若\(\lambda\)是\(A\)的特征值，则\(f(\lambda)\)是矩阵\(f(A)\)的特征值；
若\(\lambda_1,\dots ,\lambda_n\)是\(A\)的全部特征值，则\(f(\lambda_1),\dots ,f(\lambda_n)\)是\(f(A)\)的全部特征值。

证明.

设\(v\)是\(\lambda\)的一个特征向量，即\(Av=\lambda v\)。对\(\forall k\in \Z^+\)，

\begin{equation*} A^k v= A^{k-1}Av = \lambda A^{k-1}v =\cdots = \lambda^k v, \end{equation*}

即\(\lambda^k\)是\(A^k\)的特征值。

设\(f(x) = a_m x^{m}+\cdots +a_0 \)，则

\begin{align*} f(A)v\amp = a_m A^mv+\cdots + a_0 E v \\ \amp = a_m \lambda^m v+\cdots +a_0 v \\ \amp = (a_m \lambda^m +\cdots +a_0) v \\ \amp = f(\lambda)v, \end{align*}

所以\(f(\lambda)\)是矩阵\(f(A)\)的特征值。
根据定理 7.3.20，存在可逆矩阵\(P\)，使得

\begin{equation*} P^{-1}AP = \begin{pmatrix} \lambda_1 & & *\\ & \ddots & \\ & & \lambda_n \end{pmatrix}\triangleq B, \end{equation*}

也即\(A = PBP^{-1}\)。可知对\(\forall k\in \Z^+\)，

\begin{align*} A^k \amp=(PBP^{-1})^k \\ \amp = (PBP^{-1})(PBP^{-1})\cdots (PBP^{-1}) \\ \amp = PB(P^{-1}P)B (P^{-1}P)B \cdots (P^{-1}P)B P^{-1} \\ \amp = P B^kP^{-1} \\ \amp = P \begin{pmatrix} \lambda_1^k & & *\\ & \ddots & \\ & & \lambda_n^k \end{pmatrix} P^{-1}, \end{align*}

于是可知

\begin{equation*} f(A) = f(PBP^{-1}) = Pf(B)P^{-1} = P \begin{pmatrix} f(\lambda_1) & & *\\ & \ddots & \\ & & f(\lambda_n) \end{pmatrix} P^{-1}, \end{equation*}

所以\(f(\lambda_1),\dots ,f(\lambda_n)\)是\(f(A)\)的全部特征值。

请思考：命题 7.3.22中的第2个结论是否是第1个结论的直接推论？

本小节中所有关于上三角矩阵的结论都可以平行推广至下三角矩阵，使用上三角矩阵只是一种习惯而已，二者没有本质区别。

练习 7.3.5 练习

基础题.

1.

求数域\(\mathbb{F}\)上矩阵\(A\)的全部特征值和特征向量：

(1)\(A=\begin{pmatrix} 6&2&4\\2&3&2\\4&2&6 \end{pmatrix}\)；(2)\(A=\begin{pmatrix} 1&0&0\\0&a&b\\0&0&c \end{pmatrix}\)，其中\(b\neq 0\)。

2.

设矩阵\(A=\begin{pmatrix} -2&0&0\\2&a&2\\3&1&1 \end{pmatrix}\)、\(B=\begin{pmatrix} -1&0&0\\0&2&0\\0&0&b \end{pmatrix}\)相似，求\(a,b\)和\(A\)的特征值。

3.

设\(3\)阶方阵\(A\)的特征值为\(\lambda_1=\lambda_2=1,\lambda_3=-4\)，求\({\rm tr} (A)\)和\(\det A\)。

4.

设\(X=(a_1,\dots,a_n)\)且\(XX^T=1\)，求\(E_n-2X^TX\)的特征值。

提高题.

5.

设\(A\)是数域\(\mathbb{F}\)上的幂等矩阵，即\(A^2=A\)。证明：\(A\)的特征值是\(0\)或\(1\)。

6.

设\(A\)是数域\(\mathbb{F}\)上的幂零矩阵，即存在\(k\in\mathbb{N}\)使得\(A^k=0\)。证明：\(A\)的特征值都是\(0\)。

7.

设\(A\)是\(\mathbb{C}\)上\(m\times n\)矩阵，\(\lambda\)是\(\overline{A}^TA\)的一个特征值，证明：\(\lambda\)是非负实数。

8.

证明：如果任意非零向量都是方阵\(A\)的特征向量，则\(A\)是数量矩阵。

9.

设\(\alpha,\beta\)是矩阵\(A\)对应于不同特征值\(\lambda,\mu\)的特征向量，证明：\(\alpha+\beta\)不是\(A\)的特征向量。

10.

设\(A\)是数域\(\mathbb{F}\)上\(n\)阶可逆矩阵，特征值为\(\lambda_1,\dots ,\lambda_n\)，证明：

\(\lambda_1^{-1},\lambda_2^{-1},\cdots ,\lambda_n^{-1}\)是\(A^{-1}\)的全部特征值；
\((\det A)\lambda_1^{-1},(\det A)\lambda_2^{-1},\cdots ,(\det A)\lambda_n^{-1}\)是\({\rm adj}A\)的全部特征值。

11.

已知线性方程组

\begin{equation*} \left\{\begin{array}{l} x_1+x_2+x_3=1\\ 2x_1+(a+2)x_2+(a+1)x_3=a+3\\ x_1+2x_2+ax_3=3 \end{array}\right. \end{equation*}

有无穷多解，\(A\)是\(3\)阶方阵，\(X_1=(1,a,0)^T,X_2=(-a,1,0)^T,X_3=(0,0,a)^T\)为\(A\)的属于特征值\(\lambda_1=1,\lambda_2=-2,\lambda_3=-1\)的特征向量。

求\(A\)；
求\(\det ({\rm adj}A+2E)\)。

挑战题.

12.

设\(V\)是\(\mathbb{C}\)上的\(n\)维线性空间，\(\varphi ,\psi\)是\(V\)上的线性变换，且\(\varphi\psi=\psi\varphi\)，证明：

如果\(\lambda_0\)是\(\varphi\)的一个特征值，那么\(V_{\lambda_0}\)是\(\psi\)-不变子空间；
\(\varphi,\psi\)至少有一个公共的特征向量。

13.

设\(\mathbb{C}\)上\(n\)阶方阵\(A,B\)满足\(AB=BA\)，证明：\(A,B\)至少有一个公共的特征向量。

14.

设\(\mathbb{C}\)上\(m\)个\(n\)阶方阵\(A_1,\dots ,A_m\)满足

\begin{equation*} A_iA_j=A_jA_i \ (i,j=1,\dots,m), \end{equation*}

证明：\(A_1,\dots,A_m\)至少有一个公共的特征向量。

15.

设\(\mathbb{C}\)上\(n\)阶方阵\(A,B\)满足\(AB=BA\)，证明：存在可逆矩阵\(P\)，使得\(P^{-1}AP,P^{-1}BP\)同时为上三角矩阵。

16.

设\(\varphi\)是\(n\)维线性空间\(V\)上的线性变换，\(V\)有一个子空间直和分解\(V=V_1\oplus V_2\oplus\cdots\oplus V_m,\)其中\(V_i\)是\(\varphi\)-不变子空间。设\(\varphi\)限制在\(V_i\)上的特征多项式为\(f_i(\lambda)\)，证明：\(\varphi\)的特征多项式\(f(\lambda)=f_1(\lambda)f_2(\lambda)\cdots f_m(\lambda)\)。

17.

设\(\varphi\)是\(\mathbb{F}\)上\(n\)维线性空间\(V \)的线性变换，\(\lambda_0\)是\(\varphi\)的一个特征值，\(n_0\)是\(\lambda_0\)在特征多项式\(f_\varphi (\lambda)\)中的重数，证明：\(\dim V_{\lambda_0}\leq n_0\)。

18.

设\(\varphi\)是\(\mathbb{F}\)上\(n\)维线性空间\(V\)的线性变换，\(W\)是\(\varphi\)-子空间。如果\(\alpha_1,\dots,\alpha_k\)是\(\varphi\)的分别属于\(k\)个不同特征值\(\lambda_1\dots,\lambda_k\)的特征向量，且\(\alpha_1+\cdots +\alpha_k\in W\)，证明：\(\dim W\geq k\)。

向前 Top 向后