主要内容

高等代数: 多项式与线性代数

7.3 特征值与特征向量

上一节中,我们看到一些线性变换可以限制在其不变子空间上,从而获得一个相对简单的变换。本节中,我们将进一步考虑限制变换是最简单的变换,即数乘变换这一特殊情况。
\(V\)表示一个一般的数域\(\F\)(本章中,\(\F\)通常代表\(\R\)\(\C\))上的\(n\)维空间,\(\phi\)表示\(V\)上一个一般线性变换。在选定\(V\)的一个基\((\xi_1,\dots,\xi_n)\)后,利用同构的思想,\(V\)可以等同于\(\F^n\)\(V\)中的向量可以等同于\(\F^n\)中的\(n\)维列向量;相应地,\(\phi\)可以等同于它的表示矩阵\(A\)
相对于线性变换,方阵给我们的感觉更为具体和容易掌握。接下来我们会针对方阵给出线性代数的一些最重要的概念。注意:根据同构的思想,方阵和有限维空间上的线性变换本质上是一样的,因此在方阵上定义的这些重要概念也可以平行定义给线性变换。这些概念对理解线性变换和方阵的性质至关重要。

子节 7.3.1 矩阵特征值与特征向量的定义

数乘变换是最简单的线性变换,此时数乘变换所乘的数可以决定这个线性变换。对于一般的线性变换/方阵,我们引入如下的重要概念。

定义 7.3.1.

\(A\)是数域\(\mathbb{F}\)\(n\)阶方阵。若存在\(\lambda\in\mathbb{F},{\color{red}{0\neq}}v\in\mathbb{F}^n\),使得
\begin{equation} Av=\lambda v,\tag{7.3.1} \end{equation}
则称\(\lambda\)\(A\)的一个 特征值\(v\)\(A\)的属于特征值\(\lambda\)的一个 特征向量
由定义可知对于数乘变换的表示矩阵即数量矩阵\(cE_n\),其特征值就是\(c\),此时\(\F^n\)中所有非0向量都是\(c\)的特征向量。
上述定义中的要求特征向量\(v\ne 0\)非常重要,因为如果没有这个限制,允许\(v=0\),则此时对于任意的\(\lambda\)\(A0=\lambda 0\)均成立,这样就失去了定义特征值的意义。
(7.3.1)稍微改写,可得
\begin{equation} (A-\lambda E_n)v=0\tag{7.3.2} \end{equation}
把这个方程看成是以\(A-\lambda E_n\)为系数矩阵的齐次线性方程组,则特征向量\(v\)是这个线性方程组的非0解。根据齐次线性方程组有非0解的充分必要条件,可知此时\(A-\lambda E_n\)的行列式必定为0。

定义 7.3.2.

\begin{equation*} \det (\lambda E_n-A)=\left|\begin{array}{cccc} \lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\ddots& \vdots\\ \vdots&\ddots&\ddots&-a_{n-1,n}\\ -a_{n1}&\cdots &-a_{n,n-1} &\lambda-a_{nn} \end{array}\right| \end{equation*}
称为方阵\(A\)特征多项式,记为\(\chi_A(\lambda)\)
注意到齐次线性方程组的解集都是子空间,我们有下面的结论。

证明.

定理 7.3.4 中的\(V^{(A)}_{\lambda}\)称为\(A\)属于特征值\(\lambda\)特征子空间。在没有歧义的前提下,\(V^{(A)}_{\lambda}\)也常被简记为\(V_{\lambda}\)。可知特征子空间中的任意非0向量都是\(\lambda\)的特征向量,\(\lambda\)的特征向量也都落在相应特征子空间中。
接下来通过几个例子来进一步熟悉上面的一些定义。

7.3.5.

\begin{equation*} A = \begin{pmatrix} 3 & 2 & 4\\ 2 & 0 & 2\\ 4 & 2 & 3 \end{pmatrix}, \end{equation*}
求矩阵\(A\)的所有特征值和特征向量。
解答.
特征值的英文名称为eigenvalue,其前缀“eigen”来自德语,本意为“自身的”,也可理解为“表征一种内在属性的”,因此也有一些学者将eigenvalue翻译为“本征值”。
在sage中,与特征值、特征多项式、特征向量相关的命令有如下几个:
三角型矩阵的特征值和特征多项式都很好求。

7.3.6.

上三角矩阵的特征多项式。
解答.
下一个例子说明在讨论特征值相关问题时,最好在复数域上进行。

7.3.7.

分别求矩阵\(A = \begin{pmatrix} 0 & 1\\ -1 & 0 \end{pmatrix}\)在实数域和复数域上的特征值和特征向量。
解答.

子节 7.3.2 特征值、特征向量的常用性质

我们先从特征多项式根的角度着手理解特征值性质。任意数域上多项式的根都可能是复数根(如 例 7.3.7 所示),所以讨论特征值相关问题时通常是放在复数域范围内讨论。另一方面,很多工程问题天然局限在实数域范围内,所以有时我们也讨论实数域下特征值、特征向量的相关问题。

证明.

根据Viète定理( 定理 1.6.10 ),可得下述推论。
在讲解矩阵乘法时,我们强调了两个矩阵的乘积\(AB\)\(BA\)(假设都存在)通常不相等,下面的例子从特征值角度揭示了这两个积矩阵的内在联系。

7.3.12.

\(A,\ B\)\(n\)阶方阵,证明:\(\chi_{AB}(\lambda)=\chi_{BA}(\lambda)\)

7.3.13.

\(A\in\mathbb{F}^{m\times n},B\in\mathbb{F}^{n\times m}\)\(m\geq n\)。证明:
  1. \(\det (\lambda E_m-AB)=\lambda^{m-n}\det (\lambda E_n-BA)\)
  2. \({\rm tr} (AB)={\rm tr} (BA)\)
上述两个例子说明:\(AB\)\(BA\)的非0特征值集合(按重数记的多重集)必定相同。
我们再来看一下转置运算对特征值的影响。
接下来讨论特征向量的常用基本性质。

证明.

证明.

子节 7.3.3 线性变换的特征值与特征向量

根据同构的思想,\(\mathcal{L}(V)\)\(\F^{n\times n}\)同构(\(V\)是数域\(\F\)上的\(n\)维线性空间),于是在给定基的前提下每一个线性变换都可以等同于一个方阵。下面,我们特别针对线性变换给出特征值的相关定义,并说明这些定义与针对矩阵给出的定义在逻辑上是自洽的。

定义 7.3.17.

\(\varphi\)是数域\(\mathbb{F}\)\(n\)维线性空间\(V\)的线性变换。若存在\(\lambda\in\mathbb{F}\)\({\color{blue}{0\neq }}\alpha\in V\), 使得
\begin{equation*} \varphi (\alpha)=\lambda\alpha , \end{equation*}
则称\(\lambda\)是线性变换\(\varphi\)的一个特征值\(\alpha\)\(\varphi\)的属于特征值\(\lambda\)特征向量。 将
\begin{equation*} V_{\lambda}= V^{(\phi)}_{\lambda}=\{\alpha\in V|\ \varphi (\alpha)=\lambda\alpha\} \end{equation*}
称为\(\varphi\)的属于特征值\(\lambda\)特征子空间
相对于矩阵,线性变换的好处在于线性变换定义了限制变换。类似于 定理 7.3.4,可知\(V_{\lambda_0}\)\(\varphi\)-子空间,且\(\varphi\)\(V_{\lambda_0}\)上的限制变换\(\varphi|_{V_{\lambda_0}}\)就是一个数量变换,即是一个伸缩变换,伸缩比就是特征值 \(\lambda_0\)
同一个线性变换在不同基下的表示矩阵可以是不同的。当我们利用同构思想,将一个线性变换转化矩阵时,不同基下对应的矩阵是否可能有不同的特征值呢?答案是不可能。注意到同一个线性变换在不同基下表示矩阵是相似的,下面的定理解释了为什么不可能。
上述结论说明了矩阵特征值与线性变换特征值的定义在逻辑上没有矛盾,即将其用相同的名称特征值是合理的。这个性质也可叙述为矩阵特征值/特征多项式是相似变换的不变量。

定义 7.3.19.

\(\varphi\)\(\mathbb{F}\)\(n\)维线性空间\(V \)的线性变换,\(\varphi\)\(V\)的基\((\xi_1,\dots ,\xi_n)\)下的矩阵为\(A\)\(\chi_A(\lambda)\)\(A\)的特征多项式。称\(\chi_A(\lambda)\)\(\varphi\)特征多项式,记为\(\chi_{\varphi}(\lambda)\)
从逻辑上讲,\(\varphi\)的特征多项式\(\chi_{\varphi}(\lambda)\)应该由\(\varphi\)完全确定。定理 7.3.18保证了在定义 7.3.19中特征多项式的结果与基\((\xi_1,\dots ,\xi_n)\)的选择无关,即定义 7.3.19在逻辑上是自洽的。

子节 7.3.4 矩阵的上三角化

例 7.3.6中,上三角矩阵的特征值就是它的所有对角元。接下来我们说明:在复数域上,任意方阵都可以经相似变换变成上三角矩阵。

证明.

一般数域\(\mathbb{F}\)上的方阵\(A\)未必相似于\(\mathbb{F}\)上的上三角矩阵,主要原因是因为特征值可能会不落在\(\mathbb{F}\)内。事实上, 若\(A\)特征值全在\(\mathbb{F}\)中, 则在\(\mathbb{F}\)\(A\)也可以相似于上三角矩阵。

证明.

注意到上三角矩阵带入多项式中后获得的矩阵仍然是上三角矩阵,我们有下面一个常用结论

证明.

本小节中所有关于上三角矩阵的结论都可以平行推广至下三角矩阵,使用上三角矩阵只是一种习惯而已,二者没有本质区别。