主要内容

高等代数: 多项式与线性代数

7.3 特征值与特征向量

上一节中,我们看到一些线性变换可以限制在其不变子空间上,从而获得一个相对简单的变换。本节中,我们将进一步考虑限制变换是最简单的变换,即数乘变换这一特殊情况。
\(V\)表示一个数域\(\F\)(本章中,\(\F\)通常代表\(\R\)\(\C\))上的\(n\)维空间,\(\phi\)表示\(V\)上一个一般线性变换。在选定\(V\)的一个基\((\xi_1,\dots,\xi_n)\)后,利用同构的思想,\(V\)可以等同于\(\F^n\)\(V\)中的向量可以等同于\(\F^n\)中的\(n\)维列向量;相应地,\(\phi\)可以等同于它的表示矩阵\(A\)
相对于线性变换,方阵给我们的感觉更为具体和容易掌握。接下来我们会首先针对方阵给出线性代数的一些最重要概念。根据同构的思想,方阵和有限维空间上的线性变换本质上是一样的,因此在方阵上定义的这些重要概念也可以平行定义给线性变换。这些概念对理解线性变换和方阵的性质至关重要。

子节 7.3.1 矩阵特征值与特征向量的定义

数乘变换是最简单的线性变换,此时数乘变换所乘的数可以决定这个线性变换。对于一般的线性变换/方阵,我们引入如下的重要概念。

定义 7.3.1.

\(A\)是数域\(\mathbb{F}\)\(n\)阶方阵。若存在\(\lambda\in\mathbb{F},{\color{red}{0\neq}}v\in\mathbb{F}^n\),使得
\begin{equation} Av=\lambda v,\tag{7.3.1} \end{equation}
则称\(\lambda\)\(A\)的一个特征值\(v\)\(A\)属于特征值\(\lambda\)的一个特征向量
由定义可知:对于数乘变换的表示矩阵即数量矩阵\(cE_n\),其特征值就是\(c\),此时\(\F^n\)中所有非0向量都是\(c\)的特征向量。
上述定义中的要求特征向量\(v\ne 0\)非常重要,因为如果没有这个限制,允许\(v=0\),则此时对于任意的\(\lambda\)\(A0=\lambda 0\)均成立,这样就失去了定义特征值的意义。
(7.3.1)稍微改写,可得
\begin{equation} (A-\lambda E_n)v=0\tag{7.3.2} \end{equation}
把这个方程看成是以\(A-\lambda E_n\)为系数矩阵的齐次线性方程组,则特征向量\(v\)是这个线性方程组的非0解。根据齐次线性方程组有非0解的充分必要条件,可知此时\(A-\lambda E_n\)的行列式必定为0。

定义 7.3.2.

\begin{equation*} \det (\lambda E_n-A)=\left|\begin{array}{cccc} \lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\ddots& \vdots\\ \vdots&\ddots&\ddots&-a_{n-1,n}\\ -a_{n1}&\cdots &-a_{n,n-1} &\lambda-a_{nn} \end{array}\right| \end{equation*}
称为方阵\(A\)特征多项式,记为\(\chi_A(\lambda)\)
根据定义,可知下面的结论成立。
注意到齐次线性方程组的解集都是子空间,我们有下面的结论。

证明.

\(V^{(A)}_{\lambda}\)是线性方程组\((\lambda E-A)x=0\)的解集,故是子空间。
另一方面,对于任意的\(v\in V^{(A)}_{\lambda}\),有\(Av=\lambda v \in V^{(A)}_{\lambda}\),故\(V^{(A)}_{\lambda}\)是线性变换\(A\)的不变子空间。
定理 7.3.4 中的\(V^{(A)}_{\lambda}\)称为\(A\)属于特征值\(\lambda\)特征子空间。在没有歧义的前提下,\(V^{(A)}_{\lambda}\)也常被简记为\(V_{\lambda}\)。可知特征子空间中的任意非0向量都是\(\lambda\)的特征向量,\(\lambda\)的特征向量也都落在相应特征子空间中。
接下来通过几个例子来进一步熟悉上面的一些定义。

7.3.5.

\begin{equation*} A = \begin{pmatrix} 3 & 2 & 4\\ 2 & 0 & 2\\ 4 & 2 & 3 \end{pmatrix}, \end{equation*}
求矩阵\(A\)的所有特征值和特征子空间。
解答.
简单计算可知,\(A\)的特征多项式为
\begin{equation*} \chi_A(\lambda)=\lambda^3-6\lambda^2-15\lambda-8=(\lambda-8)(\lambda+1)^2, \end{equation*}
故特征值为\(\lambda=-1\)(重数为2)和\(\lambda=8\)(重数为1)。
下面分别求特征值\(\lambda=-1\)\(\lambda=8\)对应的特征向量。
  • 对于特征值\(\lambda=-1\),解线性方程组\((-E-A)x=0\)(或\((A+E)x=0\)),得到基础解系
    \begin{equation*} v_1=(1,0,-1)^T,\quad v_2= (0,1,-\frac{1}{2}), \end{equation*}
    故特征子空间
    \begin{equation*} V_{-1}=\langle (1,0,-1)^T, (0,1,-\frac{1}{2})^T\rangle=\left\{ c_1v_1+c_2v_2|c_1,c_2\in\F\right\}. \end{equation*}
  • 对于特征值\(\lambda=8\),解线性方程组\((8E-A)x=0\),得到基础解系
    \begin{equation*} v_3=(2,1,2)^T, \end{equation*}
    故特征子空间
    \begin{equation*} V_{8}=\langle (2,1,2)^T\rangle=\left\{ c_3v_3|c_3\in\F\right\}. \end{equation*}
特征值的英文名称为eigenvalue,其前缀“eigen”来自德语,本意为“自身的”,也可理解为“表征一种内在属性的”,因此也有一些学者将eigenvalue翻译为“本征值”。
在sage中,与特征值、特征多项式、特征向量相关的命令有如下几个:
三角型矩阵的特征值和特征多项式都很好求。

7.3.6. 上三角矩阵的特征值.

\(A = \begin{pmatrix} \lambda_1 & & *\\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix}\),求矩阵\(A\)的所有特征值。
解答.
根据定义和行列式的性质可知:
\begin{equation*} \chi_A(\lambda)=\det (\lambda E_n-A)=(\lambda-\lambda_1)\cdots (\lambda-\lambda_n), \end{equation*}
故全部特征值为\(\lambda_1,\dots,\lambda_n\)
结合上面的例题,我们有一个常用的结论。
下一个例子说明在讨论特征值相关问题时,最好在复数域上进行。

7.3.8.

分别求矩阵\(A = \begin{pmatrix} 0 & 1\\ -1 & 0 \end{pmatrix}\)在实数域和复数域上的特征值和特征向量。
解答.
计算可得\(A\)的特征多项式为
\begin{equation*} \chi_A(\lambda)=\lambda^2+1=(\lambda+i)(\lambda-i), \end{equation*}
故在复数域上,\(A\)的特征值为\(\lambda=i,-i\),对应的特征向量分别为
\begin{equation*} c_1(1,i)^T,c_2(1,-i)^T, \quad c_1\ne0,c_2\ne 0. \end{equation*}
在实数域上,\(A\)没有特征值,相应地也没有特征向量。

子节 7.3.2 特征值、特征向量的常用性质

我们先从特征多项式根的角度着手理解特征值性质。任意数域上多项式的根都可能是复数根(如 例 7.3.8 所示),所以讨论特征值相关问题时通常默认是放在复数域范围内讨论。另一方面,很多工程问题天然局限在实数域范围内,所以有时我们也讨论实数域下特征值、特征向量的相关问题。
下面是关于特征多项式的常用结论。

证明.

注意到
\begin{equation*} \chi_A(\lambda) = \begin{vmatrix} \lambda-a_{11} & -a_{12} &\cdots & -a_{1n}\\ -a_{21} & \lambda-a_{22} & \ddots & \vdots\\ \vdots & \ddots & \ddots & -a_{n-1,n}\\ -a_{n1} & \cdots & a_{n,n-1} & \lambda-a_{nn} \end{vmatrix}, \end{equation*}
利用行列式的展开式定义 定义 3.1.10可知结论成立。

证明.

  • 按照行列式的展开式定义,\(\chi_A(\lambda)\)中唯一可以产生\(\lambda^{n-1}\)\(n\)项乘积是所有对角元乘积,也就是说\(\chi_A(\lambda)\)与多项式
    \begin{equation*} f(\lambda)=(\lambda-a_{11})\cdots(\lambda-a_{nn}) \end{equation*}
    具有相同的\(n-1\)次方项系数。将\(f(\lambda)\)展开后可知其\(n-1\)次方项系数为
    \begin{equation*} -a_{11}-\cdots -a_{nn} = -{\rm tr}(A), \end{equation*}
    \(a_{n-1}={\rm tr} (A)\)
  • 注意到
    \begin{equation*} (-1)^n a_0 =\chi_A(0)= \det (-A) =(-1)^n \det A, \end{equation*}
    所以\(a_0=\det A\)
根据Viète定理( 定理 1.6.10 ),可得下述推论。
在讲解矩阵乘法时,我们强调了两个矩阵的乘积\(AB\)\(BA\)(假设都存在)通常不相等,下面的例子从特征值角度揭示了这两个积矩阵的内在联系。

7.3.13. \(AB\)\(BA\)的特征值.

\(A\in\mathbb{F}^{m\times n},B\in\mathbb{F}^{n\times m}\)\(m\geq n\)。证明:
  1. \(\chi_{AB}(\lambda)=\lambda^{m-n}\chi_{BA}(\lambda)\)
  2. \({\rm tr} (AB)={\rm tr} (BA)\)
  3. \(A,\ B\)均为\(n\)阶方阵时,\(\chi_{AB}(\lambda)=\chi_{BA}(\lambda)\)
解答.
  1. 注意到 \(\chi_{AB}(\lambda) = \det (\lambda E_m-AB)\)\(\chi_{BA}(\lambda) = \det (\lambda E_n-BA)\),所以这个结论是 定理 3.3.24的直接推论。
  2. 第一部分的结论说明,矩阵\(BA\)的特征值集合只是比矩阵\(AB\)特征值集合少了\(m-n\)个0,结合推论 7.3.11可知结论成立。
  3. 特取\(m =n\),可知结论成立。
上述例子说明:\(AB\)\(BA\)的非0特征值集合(按重数记的多重集)必定相同。
我们再来看一下转置运算对特征值的影响。
接下来讨论特征向量的常用基本性质。

证明.

证明.

子节 7.3.3 线性变换的特征值与特征向量

根据同构的思想,\(\mathcal{L}(V)\)\(\F^{n\times n}\)同构(\(V\)是数域\(\F\)上的\(n\)维线性空间),于是在给定基的前提下每一个线性变换都可以等同于一个方阵。下面,我们特别针对线性变换给出特征值的相关定义,并说明这些定义与针对矩阵给出的定义在逻辑上是自洽的。

定义 7.3.17.

\(\varphi\)是数域\(\mathbb{F}\)\(n\)维线性空间\(V\)的线性变换。若存在\(\lambda\in\mathbb{F}\)\({\color{blue}{0\neq }}\alpha\in V\), 使得
\begin{equation*} \varphi (\alpha)=\lambda\alpha , \end{equation*}
则称\(\lambda\)是线性变换\(\varphi\)的一个特征值\(\alpha\)\(\varphi\)的属于特征值\(\lambda\)特征向量。 将
\begin{equation*} V_{\lambda}= V^{(\varphi)}_{\lambda}=\{\alpha\in V|\ \varphi (\alpha)=\lambda\alpha\} \end{equation*}
称为\(\varphi\)的属于特征值\(\lambda\)特征子空间
相对于矩阵,线性变换的好处在于线性变换定义了限制变换。类似于 定理 7.3.4,可知\(V_{\lambda_0}\)\(\varphi\)-子空间,且\(\varphi\)\(V_{\lambda_0}\)上的限制变换\(\varphi|_{V_{\lambda_0}}\)就是一个数量变换,即是一个伸缩变换,伸缩比就是特征值 \(\lambda_0\)
同一个线性变换在不同基下的表示矩阵可以是不同的。当我们利用同构思想,将一个线性变换转化矩阵时,不同基下对应的矩阵是否可能有不同的特征值呢?答案是不可能。注意到同一个线性变换在不同基下表示矩阵是相似的,下面的定理解释了为什么不可能。
上述结论说明了矩阵特征值与线性变换特征值的定义在逻辑上没有矛盾,即将其用相同的名称特征值是合理的。这个性质也可叙述为:特征值/特征多项式在相似变换下保持不变。

定义 7.3.19.

\(\varphi\)\(\mathbb{F}\)\(n\)维线性空间\(V \)的线性变换,\(\varphi\)\(V\)的基\((\xi_1,\dots ,\xi_n)\)下的矩阵为\(A\)\(\chi_A(\lambda)\)\(A\)的特征多项式。称\(\chi_A(\lambda)\)\(\varphi\)特征多项式,记为\(\chi_{\varphi}(\lambda)\)
从逻辑上讲,\(\varphi\)的特征多项式\(\chi_{\varphi}(\lambda)\)应该由\(\varphi\)完全确定。定理 7.3.18保证了在定义 7.3.19中特征多项式的结果与基\((\xi_1,\dots ,\xi_n)\)的选择无关,即定义 7.3.19在逻辑上是自洽的。

子节 7.3.4 矩阵的上三角化

例 7.3.6中,上三角矩阵的特征值就是它的所有对角元。接下来我们说明:在复数域上,任意方阵都可以经相似变换变成上三角矩阵。

证明.

一般数域\(\mathbb{F}\)上的方阵\(A\)未必相似于\(\mathbb{F}\)上的上三角矩阵,主要原因是因为特征值可能会不落在\(\mathbb{F}\)内。事实上, 若\(A\)特征值全在\(\mathbb{F}\)中, 则在\(\mathbb{F}\)\(A\)也可以相似于上三角矩阵。

证明.

注意到上三角矩阵带入多项式后获得的矩阵仍然是上三角矩阵,我们有下面一个常用结论。

证明.

本小节中所有关于上三角矩阵的结论都可以平行推广至下三角矩阵,使用上三角矩阵只是一种习惯而已,二者没有本质区别。

练习 7.3.5 练习

基础题.

1.
求数域\(\mathbb{F}\)上矩阵\(A\)的全部特征值和特征向量:
(1)\(A=\begin{pmatrix} 6&2&4\\2&3&2\\4&2&6 \end{pmatrix}\);(2)\(A=\begin{pmatrix} 1&0&0\\0&a&b\\0&0&c \end{pmatrix}\),其中\(b\neq 0\)
解答.
  1. 矩阵\(A\)的特征多项式为
    \begin{equation*} f_A(\lambda)=\det (\lambda E_3-A)=\begin{vmatrix} \lambda-6&-2&-4\\-2&\lambda-3&-2\\-4&-2&\lambda-6 \end{vmatrix}= (\lambda-11)(\lambda-2)^2, \end{equation*}
    解得\(A\)的特征值为\(\lambda_1=11, \lambda_2=\lambda_3=2\)。 对于特征值\(\lambda_1=11\),解齐次线性方程组\((11E_3-A)X=0\),即
    \begin{equation*} \begin{pmatrix} 5&-2&-4\\-2&8&-2\\-4&-2&5 \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
    得基础解系\(X_1=(2,1,2)^T\)。故属于\(\lambda_1=11\)的特征向量为\(c_1X_1\),其中\(c_1\)\(\mathbb{F}\)中任意非零常数。
    对于特征值\(\lambda_2=\lambda_3=2\),解齐次线性方程组\((2E_3-A)X=0\),即
    \begin{equation*} \begin{pmatrix} -4&-2&-4\\-2&-1&-2\\-4&-2&-4 \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
    得基础解系\(X_2=(-1,2,0)^T,X_3=(-1,0,1)^T\)。故属于\(\lambda_2=\lambda_3=2\)的特征向量为\(c_2X_2+c_3X_3\),其中\(c_2,c_3\)\(\mathbb{F}\)中不全为0的常数。
  2. 矩阵\(A\)的特征多项式为
    \begin{equation*} f_A(\lambda)=\det (\lambda E_3-A)=\begin{vmatrix} \lambda-1&0&0\\0&\lambda-a&-b\\0&0&\lambda-c \end{vmatrix}= (\lambda-1)(\lambda-a)(\lambda-c). \end{equation*}
    以下分5种情况考虑特征值、特征向量。
    1. \(a=c=1\)时,\(f_A(\lambda)=(\lambda-1)^3\)\(A\)的特征值为\(\lambda_1=\lambda_2=\)\(\lambda_3=1\) 对于\(\lambda_1=\lambda_2=\lambda_3=1\),解齐次线性方程组\((E_3-A)X=0\),即
      \begin{equation*} \begin{pmatrix} 0&0&0\\0&0&-b\\0&0&0 \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
      得基础解系\(X_1=(1,0,0)^T,X_2=(0,1,0)^T\)。此时,属于\(\lambda_1=\lambda_2=\lambda_3=1\)的特征向量为\(c_1X_1+c_2X_2\),其中\(c_1,c_2\)\(\mathbb{F}\)中不全为0的常数。
    2. \(a=c\neq 1\)时,\(f_A(\lambda)=(\lambda-1)(\lambda-a)^2\)\(A\)的特征值为
      \begin{equation*} \lambda_1=1,\lambda_2=\lambda_3=a. \end{equation*}
      对于\(\lambda_1=1\),解齐次线性方程组\((E_3-A)X=0\),即
      \begin{equation*} \begin{pmatrix} 0&0&0\\0&1-a&-b\\0&0&1-a \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
      得基础解系\(X_1=(1,0,0)^T\)。此时,属于\(\lambda_1=1\)的特征向量为\(c_1X_1\),其中\(c_1\)\(\mathbb{F}\)中非零的常数。 对于\(\lambda_2=\lambda_3=a\),解齐次线性方程组\((aE-A)X=0\),即
      \begin{equation*} \begin{pmatrix} a-1&0&0\\0&0&-b\\0&0&0 \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
      得基础解系\(X_2=(0,1,0)^T\)。此时,属于\(\lambda_2=\lambda_3=a\)的特征向量为\(c_2X_2\),其中\(c_2\)\(\mathbb{F}\)中非零的常数。
    3. \(a=1,c\neq 1\)时,\(f_A(\lambda)=(\lambda-1)^2(\lambda-c)\)\(A\)的特征值为
      \begin{equation*} \lambda_1=\lambda_2=1,\lambda_3=c. \end{equation*}
      对于\(\lambda_1=\lambda_2=1\),解齐次线性方程组\((E_3-A)X=0\),即
      \begin{equation*} \begin{pmatrix} 0&0&0\\0&0&-b\\0&0&1-c \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
      得基础解系\(X_1=(1,0,0)^T,X_2=(0,1,0)^T\)。此时,属于\(\lambda_1=\lambda_2=1\)的特征向量为\(c_1X_1+c_2X_2\),其中\(c_1,c_2\)\(\mathbb{F}\)中不全为0的常数。 对于\(\lambda_3=c\),解齐次线性方程组\((cE-A)X=0\),即
      \begin{equation*} \begin{pmatrix} c-1&0&0\\0&c-1&-b\\0&0&0 \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
      得基础解系\(X_3=(0,b,c-1)^T\)。此时,属于\(\lambda_3=c\)的特征向量为\(c_3X_3\),其中\(c_3\)\(\mathbb{F}\)中非零的常数。
    4. \(a\neq 1,c=1\)时,\(f_A(\lambda)=(\lambda-1)^2(\lambda-a)\)\(A\)的特征值为
      \begin{equation*} \lambda_1=\lambda_2=1,\lambda_3=a. \end{equation*}
      对于\(\lambda_1=\lambda_2=1\),解齐次线性方程组\((E_3-A)X=0\),即
      \begin{equation*} \begin{pmatrix} 0&0&0\\0&1-a&-b\\0&0&0 \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
      得基础解系\(X_1=(1,0,0)^T,X_2=(0,b,1-a)^T\)。此时,属于\(\lambda_1=\lambda_2=1\)的特征向量为\(c_1X_1+c_2X_2\),其中\(c_1,c_2\)\(\mathbb{F}\)中不全为0的常数。 对于\(\lambda_3=a\),解齐次线性方程组\((aE-A)X=0\),即
      \begin{equation*} \begin{pmatrix} a-1&0&0\\0&0&-b\\0&0&a-c \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
      得基础解系\(X_3=(0,1,0)^T\)。此时,属于\(\lambda_3=a\)的特征向量为\(c_3X_3\),其中\(c_3\)\(\mathbb{F}\)中非零的常数。
    5. \(a,c,1\)两两不同时,\(f_A(\lambda)=(\lambda-1)(\lambda-a)(\lambda-c)\)\(A\)的特征值为
      \begin{equation*} \lambda_1=1,\lambda_2=a,\lambda_3=c. \end{equation*}
      对于\(\lambda_1=1\),解齐次线性方程组\((E_3-A)X=0\),即
      \begin{equation*} \begin{pmatrix} 0&0&0\\0&1-a&-b\\0&0&1-c \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
      得基础解系\(X_1=(1,0,0)^T\)。此时,属于\(\lambda_1=1\)的特征向量为\(c_1X_1\),其中\(c_1\)\(\mathbb{F}\)中非零常数。 对于\(\lambda_2=a\),解齐次线性方程组\((aE-A)X=0\),即
      \begin{equation*} \begin{pmatrix} a-1&0&0\\0&0&-b\\0&0&a-c \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
      得基础解系\(X_2=(0,1,0)^T\)。此时,属于\(\lambda_3=a\)的特征向量为\(c_2X_2\),其中\(c_2\)\(\mathbb{F}\)中非零的常数。
      对于\(\lambda_3=c\),解齐次线性方程组\((cE-A)X=0\),即
      \begin{equation*} \begin{pmatrix} c-1&0&0\\0&c-a&-b\\0&0&0 \end{pmatrix}\begin{pmatrix} x_1\\x_2\\x_3 \end{pmatrix}=\begin{pmatrix} 0\\0\\0 \end{pmatrix} \end{equation*}
      得基础解系\(X_3=(0,b,c-a)^T\)。此时,属于\(\lambda_3=c\)的特征向量为\(c_3X_3\),其中\(c_3\)\(\mathbb{F}\)中非零的常数。
2.
设矩阵\(A=\begin{pmatrix} -2&0&0\\2&a&2\\3&1&1 \end{pmatrix}\)\(B=\begin{pmatrix} -1&0&0\\0&2&0\\0&0&b \end{pmatrix}\)相似,求\(a,b\)\(A\)的特征值。
解答.
因为\(A\)\(B\)相似,所以\(A\)\(B\)有相同的特征值。注意到\(-2\)\(A\)的一个特征值,所以\(-2\)也是\(B\)的一个特征值。而\(B\)的全部特征值为\(-1,2,b\),故\(b=-2\)\(A\)的特征值有\(-1\)\(-2\)\(2\)
\(A\)\(B\)相似可知\({{\rm{tr}}}(A)={{\rm{tr}}(B)}\),即\(a-1=b+1\),因此\(a=0\)
3.
\(3\)阶方阵\(A\)的特征值为\(\lambda_1=\lambda_2=1,\lambda_3=-4\),求\({\rm tr} (A)\)\(\det A\)
解答.
\({\rm tr}(A)=\lambda_1+\lambda_2+\lambda_3=-2\)\(\det A =\lambda_1\lambda_2\lambda_3= -4\)
4.
\(X=(a_1,\dots,a_n)\)\(XX^T=1\),求\(E_n-2X^TX\)的特征值。
解答.
\(M=E_n-2X^TX\),则
\begin{equation*} f_M(\lambda)=\det(\lambda E_n-M)=\det ((\lambda-1)E_n+2X^TX). \end{equation*}
注意到\(\forall A\in\mathbb{F}^{m\times n},B\in\mathbb{F}^{n\times m}\)
\begin{equation*} \det (\lambda E_m-AB)=\lambda^{m-n} \det (\lambda E_n-BA)\mbox{,} \end{equation*}
\begin{equation*} f_M(\lambda)=(\lambda-1)^{n-1}\det((\lambda-1)E_1+2XX^T)\mbox{。} \end{equation*}
\(XX^T=1\),故
\begin{equation*} f_M(\lambda)=(\lambda-1)^{n-1}(\lambda+1)\mbox{。} \end{equation*}
因此,\(M=E_n-2X^TX\)的特征值为\(\lambda_1=\lambda_2=\cdots =\lambda_{n-1}=1,\lambda_n=-1\)

提高题.

5.
\(A\)是数域\(\mathbb{F}\)上的幂等矩阵,即\(A^2=A\)。证明:\(A\)的特征值是\(0\)\(1\)
解答.
\(\lambda\)\(A\)的一个特征值,\(X\)为相应于\(\lambda\)的一个特征向量。则
\begin{equation*} \lambda^2X=A^2X=AX=\lambda X. \end{equation*}
因为\(X\ne 0\),所以\(\lambda^2=\lambda\),于是\(\lambda=0\)\(\lambda=1\)
6.
\(A\)是数域\(\mathbb{F}\)上的幂零矩阵,即存在\(k\in\mathbb{N}\)使得\(A^k=0\)。证明:\(A\)的特征值都是\(0\)
解答.
\(\lambda\)\(A\)的一个特征值,\(X\)为相应于\(\lambda\)的一个特征向量。则
\begin{equation*} \lambda^kX=A^k X=0. \end{equation*}
因为\(X\ne 0\),所以\(\lambda^k=0\),于是\(\lambda=0\)
7.
\(A\)\(\mathbb{C}\)\(m\times n\)矩阵,\(\lambda\)\(\overline{A}^TA\)的一个特征值,证明:\(\lambda\)是非负实数。
解答.
\(\lambda\)\(\overline{A}^TA\)的特征值,则存在\(0\neq X\in\mathbb{C}^n\),使得\(\overline{A}^TAX=\lambda X\)。 两边同时左乘\(\overline{X}^T\),得
\begin{equation*} \overline{X}^T\overline{A}^TAX=\overline{X}^T(\lambda X), \end{equation*}
\begin{equation*} (\overline{AX})^T(AX)=\lambda (\overline{X}^TX). \end{equation*}
\(X=(x_1,x_2,\cdots ,x_n)^T\in\mathbb{C}^n, AX=(y_1,y_2,\cdots ,y_m)^T\in\mathbb{C}^m\),由\(X\neq 0\)可知
\begin{equation*} \overline{X}^TX=\overline{x_1}x_1+\overline{x_2}x_2+\cdots +\overline{x_n}x_n\in\mathbb{R}^+, \end{equation*}
\begin{equation*} (\overline{AX})^T(AX)=\overline{y_1}y_1+\overline{y_2}y_2+\cdots +\overline{y_m}y_m\in\mathbb{R}^{\geq 0}. \end{equation*}
\(\lambda=\frac{(\overline{AX})^T(AX)}{\overline{X}^TX}=\frac{\overline{y_1}y_1+\overline{y_2}y_2+\cdots +\overline{y_m}y_m}{\overline{x_1}x_1+\overline{x_2}x_2+\cdots +\overline{x_n}x_n}\)是非负实数。
8.
证明:如果任意非零向量都是方阵\(A\)的特征向量,则\(A\)是数量矩阵。
解答.
\(\varepsilon_1,\varepsilon_2,\cdots ,\varepsilon_n\)\(n\)维标准单位列向量,由题设它们都是\(A\)的特征向量,即存在特征值\(\lambda_i\)使得\(A \varepsilon_i=\lambda_i \varepsilon_i\),故
\begin{equation*} A(\varepsilon_1,\varepsilon_2,\cdots ,\varepsilon_n)=(\lambda_1\varepsilon_1,\lambda_2\varepsilon_2,\cdots ,\lambda_n\varepsilon_n), \end{equation*}
\(A={\rm{diag}}(\lambda_1,\lambda_2,\cdots ,\lambda_n)\)。又\(X=(1,1,\cdots ,1)^T\)也是\(A\)的特征向量,故存在\(\mu\in\mathbb{F}\)使得\(AX=\mu X\),即\((\lambda_1,\lambda_2,\cdots ,\lambda_n)^T=(\mu,\mu,\cdots ,\mu)^T\)。因此,\(A=\mu E_n\)是数量矩阵。
9.
\(\alpha,\beta\)是矩阵\(A\)对应于不同特征值\(\lambda,\mu\)的特征向量,证明:\(\alpha+\beta\)不是\(A\)的特征向量。
解答.
假设\(\alpha+\beta\)\(A\)的特征向量,则存在\(a\in\mathbb{F}\),使得
\begin{equation*} A(\alpha+\beta)=a(\alpha+\beta), \end{equation*}
\(A\alpha+A\beta=a\alpha+a\beta\)。由已知,\(A\alpha=\lambda \alpha,A\beta=\mu \beta\),所以
\begin{equation*} (\lambda-a)\alpha+(\mu-a)\beta=0. \end{equation*}
注意到属于不同特征值\(\lambda,\mu\)的特征向量\(\alpha,\beta\)线性无关,所以
\begin{equation*} \lambda-a=\mu-a=0. \end{equation*}
\(\lambda=\mu=a\),这与\(\lambda\neq \mu\)相矛盾。因此,\(\alpha+\beta\)不是\(A\)的特征向量。
10.
\(A\)是数域\(\mathbb{F}\)\(n\)阶可逆矩阵,特征值为\(\lambda_1,\dots ,\lambda_n\),证明:
  1. \(\lambda_1^{-1},\dots ,\lambda_n^{-1}\)\(A^{-1}\)的全部特征值;
  2. \((\det A)\lambda_1^{-1},\dots,(\det A)\lambda_n^{-1}\)\({\rm adj}A\)的全部特征值。
解答.
  1. 因为\(A\)可逆,所以\(\lambda_i\neq 0(i=1,2,\cdots ,n)\)。由题意知,\(n\)阶矩阵\(A\)\(n\)个特征值\(\lambda_1,\lambda_2,\cdots ,\lambda_n\),所以\(A\)相似于上三角阵,即存在可逆矩阵\(P\),使得
    \begin{equation*} P^{-1}AP= \begin{pmatrix} \lambda_1&*&\cdots&*\\ 0&\lambda_2&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n \end{pmatrix}. \end{equation*}
    两边同时取逆,得
    \begin{equation*} P^{-1}A^{-1}P= \begin{pmatrix} \lambda_1^{-1}&*&\cdots&*\\ 0&\lambda_2^{-1}&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&\lambda_n^{-1} \end{pmatrix}. \end{equation*}
    \(\lambda_1^{-1},\dots ,\lambda_n^{-1}\)\(A^{-1}\)的全部特征值。
  2. \(A\)可逆,所以\({\rm adj}A=(\det A)A^{-1}\),则
    \begin{align*} P^{-1}{\rm adj}AP & = & (\det A)P^{-1}A^{-1}P\\ & = &\begin{pmatrix} (\det A)\lambda_1^{-1}&*&\cdots&*\\ 0&(\det A)\lambda_2^{-1}&\cdots&*\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&(\det A)\lambda_n^{-1} \end{pmatrix}. \end{align*}
    \((\det A)\lambda_1^{-1},(\det A)\lambda_2^{-1},\cdots ,(\det A)\lambda_n^{-1}\)\({\rm adj}A\)的全部特征值。
11.
已知线性方程组
\begin{equation*} \left\{\begin{array}{l} x_1+x_2+x_3=1\\ 2x_1+(a+2)x_2+(a+1)x_3=a+3\\ x_1+2x_2+ax_3=3 \end{array}\right. \end{equation*}
有无穷多解,\(A\)\(3\)阶方阵,\(X_1=(1,a,0)^T,X_2=(-a,1,0)^T,X_3=(0,0,a)^T\)\(A\)的属于特征值\(\lambda_1=1,\lambda_2=-2,\lambda_3=-1\)的特征向量。
  1. \(A\)
  2. \(\det ({\rm adj}A+2E)\)
解答.
  1. 因为该线性方程组有无穷多解,所以\(\begin{vmatrix} 1&1&1\\2&a+2&a+1\\1&2&a \end{vmatrix}=0\),解得\(a=1\)。因此,\(X_1=(1,1,0)^T,X_2=(-1,1,0)^T,X_3=(0,0,1)^T\)\(A\)的属于特征值\(\lambda_1=1,\lambda_2=-2,\lambda_3=-1\)的特征向量。令\(P=(X_1,X_2,X_3)\),则\(AP=P{\rm{diag}}(\lambda_1,\lambda_2,\lambda_3)\)。因此
    \begin{equation*} A=P{\rm{diag}}(\lambda_1,\lambda_2,\lambda_3)P^{-1}=\begin{pmatrix} -\frac{1}{2}&\frac{3}{2}&0\\\frac{3}{2}&-\frac{1}{2}&0\\0&0&-1 \end{pmatrix} \end{equation*}
  2. 因为\(A\)的特征值为\(1,-2,-1\),所以\(\det A=2\)。根据上题结论, \(A^*+2E=2A^{-1}+2E\)的特征值为\(4,1,0\) 。因此,\(\det (A^*+2E)=0\)

挑战题.

12.
\(V\)\(\mathbb{C}\)上的\(n\)维线性空间,\(\varphi ,\psi\)\(V\)上的线性变换,且\(\varphi\psi=\psi\varphi\),证明:
  1. 如果\(\lambda_0\)\(\varphi\)的一个特征值,那么\(V_{\lambda_0}\)\(\psi\)-不变子空间;
  2. \(\varphi,\psi\)至少有一个公共的特征向量。
解答.
  1. 对任意\(\alpha\in V_{\lambda_0}\),因\(\varphi\psi=\psi\varphi\),所以
    \begin{equation*} \varphi(\psi(\alpha))=\psi(\varphi(\alpha))=\psi (\lambda_0 \alpha)=\lambda_0\psi(\alpha), \end{equation*}
    \(\psi(\alpha)\in V_{\lambda_0}\)。故\(V_{\lambda_0}\)\(\psi\)-不变子空间。
  2. 项 7.3.5.12.a 知,\(\psi|_{V_{\lambda_0}}\)\(V_{\lambda_0}\)上线性变换。由于\(V_{\lambda_0}\)是复数域上的线性空间,所以\(\psi|_{V_{\lambda_0}}\)至少存在一个复特征值\(c\)和相应特征向量\(X\),故\(\psi|_{V_{\lambda_0}}(X)=cX\),即\(\psi(X)=cX\)。因此,\(X\)\(\psi\)的特征向量。又\(X\in V_{\lambda_0}\),所以\(X\)也是\(\varphi\)的特征向量。从而,\(\varphi,\psi\)至少有一个公共的特征向量。
13.
\(\mathbb{C}\)\(n\)阶方阵\(A,B\)满足\(AB=BA\),证明:\(A,B\)至少有一个公共的特征向量。
解答.
分别定义\(\mathbb{C}^n\)上的线性变换\(\varphi,\psi\)如下:
\begin{equation*} \varphi:\mathbb{C}^n\rightarrow\mathbb{C}^n,\alpha\mapsto A \alpha,\quad \psi:\mathbb{C}^n\rightarrow\mathbb{C}^n,\alpha\mapsto B \alpha. \end{equation*}
\(AB=BA\)可知\(\varphi\psi=\psi\varphi\)。根据 练习 7.3.5.12 结论,\(\varphi,\psi\)至少有一个公共的特征向量。故存在\(\lambda,\mu\in\mathbb{C}\)\(0\neq X\in\mathbb{C}^n\)使得
\begin{equation*} \varphi(X)=\lambda X,\psi(X)=\mu X, \end{equation*}
\begin{equation*} AX=\lambda X,BX=\mu X\mbox{。} \end{equation*}
因此,\(A,B\)至少有一个公共的特征向量。
14.
\(\mathbb{C}\)\(m\)\(n\)阶方阵\(A_1,\dots,A_m\)满足\(A_iA_j=A_jA_i(i,j=1,\dots,m)\),证明:\(A_1,\dots,A_m\)至少有一个公共的特征向量。
解答.
\(m\)归纳证明。
\(m=2\)时,根据上题知结论成立。
假设对于\(m-1\)个矩阵时结论成立,以下考虑\(m\)个矩阵的情形。因\(A_m\)\(\mathbb{C}\)\(n\)阶方阵,\(A_m\)至少存在一个特征值\(\lambda_m\),相应的特征子空间为\(V_{\lambda_m}\)。由于\(A_1,\dots,A_m\)两两可交换,类似12题的证明知\(V_{\lambda_m}\)\(A_i(i=1,\dots,m-1)\)的不变子空间。令\(A_i|_{V_{\lambda_m}}\)\(A_i\)\(V_{\lambda_m}\)上的限制,则
\begin{equation*} A_i|_{V_{\lambda_m}}A_j|_{V_{\lambda_m}}=A_j|_{V_{\lambda_m}}A_i|_{V_{\lambda_m}},(i,j=1,\dots ,m-1). \end{equation*}
由归纳假设,存在\(Y\in V_{\lambda_m}\),使得
\begin{equation*} A_i|_{V_{\lambda_m}}Y=\lambda_i Y,\ i=1,\dots,m-1, \end{equation*}
\(A_iY=\lambda_iY,i=1,\dots,m-1\)。又\(Y\in V_{\lambda_m}\),故\(A_mY=\lambda_m Y\)。 从而,\(A_1,\dots,A_m\)至少有一个公共的特征向量\(Y\)
15.
\(\mathbb{C}\)\(n\)阶方阵\(A,B\)满足\(AB=BA\),证明:存在可逆矩阵\(P\),使得\(P^{-1}AP,P^{-1}BP\)同时为上三角矩阵。
解答.
\(n\)归纳证明。
\(n=1\)时,结论显然成立。
假设对于\(n-1\)阶矩阵结论成立,以下考虑\(n\)阶矩阵的情形。
由于\(AB=BA\),根据 练习 7.3.5.13 结论,\(A\)\(B\)至少存在一个公共的特征向量\(X\),即存在\(\lambda,\mu\in\mathbb{C}\)使得\(AX=\lambda X,BX=\mu X\)
\(X\)扩充为\(\mathbb{C}^n\)的一个基\(X,X_2,\cdots ,X_n\)。令\(P_1=(X,X_2,\cdots ,X_n)\),则\(P_1\)可逆且
\begin{equation*} P_1^{-1}AP_1=\begin{pmatrix} \lambda&\alpha \\ 0&A_1 \end{pmatrix},P_1^{-1}BP_1=\begin{pmatrix} \mu&\beta \\ 0&B_1 \end{pmatrix}, \end{equation*}
其中\(A_1,B_1\)\(\mathbb{C}\)\(n-1\)阶方阵。因为\(AB=BA\),所以
\begin{equation*} \begin{pmatrix} \lambda&\alpha \\ 0&A_1 \end{pmatrix} \begin{pmatrix} \mu&\beta \\ 0&B_1 \end{pmatrix}=\begin{pmatrix} \mu&\beta \\ 0&B_1 \end{pmatrix}\begin{pmatrix} \lambda&\alpha \\ 0&A_1 \end{pmatrix}, \end{equation*}
\(A_1B_1=B_1A_1\)。由归纳假设,存在\(n-1\)阶可逆复矩阵\(P_2\),使得\(P_2^{-1}A_1P_2,P_2^{-1}B_1P_2\)均为上三角矩阵。
\(P=P_1 \begin{pmatrix} 1&0\\0&P_2 \end{pmatrix}\),则\(P\)可逆且
\begin{equation*} P^{-1}AP=\begin{pmatrix} 1&0\\0&P_2 \end{pmatrix}^{-1}P_1^{-1}AP_1\begin{pmatrix} 1&0\\0&P_2 \end{pmatrix}=\begin{pmatrix} \lambda&\alpha P_2\\ 0&P_2^{-1}A_1P_2 \end{pmatrix}, \end{equation*}
\begin{equation*} P^{-1}BP=\begin{pmatrix} 1&0\\0&P_2 \end{pmatrix}^{-1}P_1^{-1}BP_1\begin{pmatrix} 1&0\\0&P_2 \end{pmatrix}=\begin{pmatrix} \mu&\beta P_2\\ 0&P_2^{-1}B_1P_2 \end{pmatrix} \end{equation*}
均为上三角矩阵。
16.
\(\varphi\)\(n\)维线性空间\(V\)上的线性变换,\(V\)有一个子空间直和分解\(V=V_1\oplus \cdots\oplus V_m,\)其中\(V_i\)\(\varphi\)-不变子空间。设\(\varphi\)限制在\(V_i\)上的特征多项式为\(f_i(\lambda)\),证明:\(\varphi\)的特征多项式\(f(\lambda)=f_1(\lambda)\cdots f_m(\lambda)\)
解答.
\(\xi_{i1},\dots,\xi_{in_i}\)\(V_i\)的基,\(i=1,\dots,m\)。由于\(V=V_1\oplus \cdots\oplus V_m\),所以 \(\xi_{11},\dots ,\xi_{1n_1},\xi_{21},\dots,\xi_{2n_2},\dots,\xi_{m1},\dots ,\xi_{mn_m}\)\(V\)的一个基。注意到\(V_i\)\(\varphi\)-不变子空间,所以\(\varphi\)在基
\begin{equation*} \xi_{11},\dots ,\xi_{1n_1},\xi_{21},\dots ,\xi_{2n_2},\dots ,\xi_{m1},\cdots ,\xi_{mn_m} \end{equation*}
下的矩阵\(A=\begin{pmatrix} A_1&&&\\ &A_2&&\\ &&\ddots&\\ &&&A_m \end{pmatrix},\)其中\(A_i\)\(\varphi|_{V_i}\)在基\(\xi_{i1},\dots ,\xi_{in_i}\)下的矩阵。因此,\(\varphi\)的特征多项式
\begin{equation*} f(\lambda)=f_A(\lambda)=\begin{vmatrix} \lambda E-A_1&&&\\ &\lambda E-A_2&&\\ &&\ddots&\\ &&&\lambda E-A_m \end{vmatrix}=f_1(\lambda)f_2(\lambda)\cdots f_m(\lambda)\mbox{。} \end{equation*}
17.
\(\varphi\)\(\mathbb{F}\)\(n\)维线性空间\(V \)的线性变换,\(\lambda_0\)\(\varphi\)的一个特征值,\(n_0\)\(\lambda_0\)在特征多项式\(f_\varphi (\lambda)\)中的重数,证明:\(\dim V_{\lambda_0}\leq n_0\)
解答.
\(\xi_1,\dots,\xi_{s_0}\)\(V_{\lambda_0}\)的一个基,将其扩充为\(V\)的一个基
\begin{equation*} \xi_1,\dots,\xi_{s_0},\xi_{s_0+1},\dots,\xi_n, \end{equation*}
\(\varphi\)在基\(\xi_1,\dots ,\xi_{s_0},\xi_{s_0+1},\dots ,\xi_n\)下的矩阵为\(A=\begin{pmatrix} \lambda_0 E_{s_0}&B\\ 0&C \end{pmatrix}\)。于是,
\begin{equation*} f_{\varphi}(\lambda)=f_A(\lambda)=\begin{vmatrix} (\lambda -\lambda_0) E_{s_0}&-B\\ 0&\lambda E-C \end{vmatrix}=(\lambda- \lambda_0)^{s_0}\det(\lambda E-C)\mbox{。} \end{equation*}
因此\(n_0\geq s_0\),即\(n_0\geq\dim V_{\lambda_0}\)
18.
\(\varphi\)\(\mathbb{F}\)\(n\)维线性空间\(V \)的线性变换,\(\lambda_0\)\(\varphi\)的一个特征值,\(n_0\)\(\lambda_0\)在特征多项式\(f_\varphi (\lambda)\)中的重数,证明:\(\dim V_{\lambda_0}\leq n_0\)
解答.
\(\xi_1,\xi_2,\cdots ,\xi_{s_0}\)\(V_{\lambda_0}\)的一个基,将其扩充为\(V\)的一个基
\begin{equation*} \xi_1,\xi_2,\cdots ,\xi_{s_0},\xi_{s_0+1},\cdots ,\xi_n, \end{equation*}
\(\varphi\)在基\(\xi_1,\xi_2,\cdots ,\xi_{s_0},\xi_{s_0+1},\cdots ,\xi_n\)下的矩阵为\(A=\begin{pmatrix} \lambda_0 E_{s_0}&B\\ 0&C \end{pmatrix}\)。于是,
\begin{equation*} f_{\varphi}(\lambda)=f_A(\lambda)=\begin{vmatrix} (\lambda -\lambda_0) E_{s_0}&-B\\ 0&\lambda E-C \end{vmatrix}=(\lambda- \lambda_0)^{s_0}\det(\lambda E-C)\mbox{。} \end{equation*}
因此\(n_0\geq s_0\),即\(n_0\geq\dim V_{\lambda_0}\)