主要内容\(\newcommand{\Ima}{\rm Im }
\newcommand{\N}{\mathbb N}
\newcommand{\Z}{\mathbb Z}
\newcommand{\Q}{\mathbb Q}
\newcommand{\R}{\mathbb R}
\newcommand{\F}{\mathbb F}
\newcommand{\C}{\mathbb C}
\newcommand{\K}{\mathbb K}
\newcommand{\myunit}{1 cm}
\newcommand{\blue}[1]{{\color{blue}#1}}
\newcommand\iddots{\mathinner{
\kern1mu\raise1pt{.}
\kern2mu\raise4pt{.}
\kern2mu\raise7pt{\Rule{0pt}{7pt}{0pt}.}
\kern1mu
}}
\tikzset{
node style sp/.style={draw,circle,minimum size=\myunit},
node style ge/.style={circle,minimum size=\myunit},
arrow style mul/.style={draw,sloped,midway,fill=white},
arrow style plus/.style={midway,sloped,fill=white},
}
\newcommand{\lt}{<}
\newcommand{\gt}{>}
\newcommand{\amp}{&}
\definecolor{fillinmathshade}{gray}{0.9}
\newcommand{\fillinmath}[1]{\mathchoice{\colorbox{fillinmathshade}{$\displaystyle \phantom{\,#1\,}$}}{\colorbox{fillinmathshade}{$\textstyle \phantom{\,#1\,}$}}{\colorbox{fillinmathshade}{$\scriptstyle \phantom{\,#1\,}$}}{\colorbox{fillinmathshade}{$\scriptscriptstyle\phantom{\,#1\,}$}}}
\)
节 7.3 特征值与特征向量
上一节中,我们看到一些线性变换可以限制在其不变子空间上,从而获得一个相对简单的变换。本节中,我们将进一步考虑限制变换是最简单的变换,即数乘变换这一特殊情况。
用\(V\)表示一个一般的数域\(\F\)(本章中,\(\F\)通常代表\(\R\)或\(\C\))上的\(n\)维空间,\(\phi\)表示\(V\)上一个一般线性变换。在选定\(V\)的一个基\((\xi_1,\dots,\xi_n)\)后,利用同构的思想,\(V\)可以等同于\(\F^n\),\(V\)中的向量可以等同于\(\F^n\)中的\(n\)维列向量;相应地,\(\phi\)可以等同于它的表示矩阵\(A\)。
相对于线性变换,方阵给我们的感觉更为具体和容易掌握。接下来我们会针对方阵给出线性代数的一些最重要的概念。注意:根据同构的思想,方阵和有限维空间上的线性变换本质上是一样的,因此在方阵上定义的这些重要概念也可以平行定义给线性变换。这些概念对理解线性变换和方阵的性质至关重要。
子节 7.3.1 矩阵特征值与特征向量的定义
数乘变换是最简单的线性变换,此时数乘变换所乘的数可以决定这个线性变换。对于一般的线性变换/方阵,我们引入如下的重要概念。
定义 7.3.1.
设\(A\)是数域\(\mathbb{F}\)上\(n\)阶方阵。若存在\(\lambda\in\mathbb{F},{\color{red}{0\neq}}v\in\mathbb{F}^n\),使得
\begin{equation}
Av=\lambda v,\tag{7.3.1}
\end{equation}
则称\(\lambda\)是\(A\)的一个 特征值,\(v\)是\(A\)的属于特征值\(\lambda\)的一个 特征向量。
由定义可知对于数乘变换的表示矩阵即数量矩阵\(cE_n\),其特征值就是\(c\),此时\(\F^n\)中所有非0向量都是\(c\)的特征向量。
上述定义中的要求特征向量\(v\ne 0\)非常重要,因为如果没有这个限制,允许\(v=0\),则此时对于任意的\(\lambda\),\(A0=\lambda 0\)均成立,这样就失去了定义特征值的意义。
\begin{equation}
(A-\lambda E_n)v=0\tag{7.3.2}
\end{equation}
把这个方程看成是以\(A-\lambda E_n\)为系数矩阵的齐次线性方程组,则特征向量\(v\)是这个线性方程组的非0解。根据齐次线性方程组有非0解的充分必要条件,可知此时\(A-\lambda E_n\)的行列式必定为0。
定义 7.3.2.
\begin{equation*}
\det (\lambda E_n-A)=\left|\begin{array}{cccc}
\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\
-a_{21}&\lambda-a_{22}&\ddots& \vdots\\
\vdots&\ddots&\ddots&-a_{n-1,n}\\
-a_{n1}&\cdots &-a_{n,n-1} &\lambda-a_{nn}
\end{array}\right|
\end{equation*}
称为方阵\(A\)的特征多项式,记为\(\chi_A(\lambda)\)。
定理 7.3.3.
设\(A\)是数域\(\mathbb{F}\)上的\(n\)阶方阵,则
\(\lambda_0\)是\(A\)的特征值当且仅当\(\lambda_0\)是\(A\)的特征多项式\(\chi_A(\lambda)\)在\(\mathbb{F}\)中的根。
\(\alpha\)是\(A\)的属于特征值\(\lambda_0\)的特征向量当且仅当\(\alpha\)是齐次线性方程组\((\lambda_0E-A)v=0\)的一个非零解。
注意到齐次线性方程组的解集都是子空间,我们有下面的结论。
定理 7.3.4.
设\(\lambda\)是\(A\)的一个特征值,则
\begin{equation*}
V^{(A)}_{\lambda}=\{v \in\mathbb{F}^n|\ Av=\lambda v\}
\end{equation*}
是\(\mathbb{F}^n\)的子空间,且是线性变换\(A\)的不变子空间。
证明.
定理 7.3.4 中的
\(V^{(A)}_{\lambda}\)称为
\(A\)属于特征值
\(\lambda\)的
特征子空间。在没有歧义的前提下,
\(V^{(A)}_{\lambda}\)也常被简记为
\(V_{\lambda}\)。可知特征子空间中的任意非0向量都是
\(\lambda\)的特征向量,
\(\lambda\)的特征向量也都落在相应特征子空间中。
接下来通过几个例子来进一步熟悉上面的一些定义。
例 7.3.5.
设
\begin{equation*}
A = \begin{pmatrix}
3 & 2 & 4\\
2 & 0 & 2\\
4 & 2 & 3
\end{pmatrix},
\end{equation*}
求矩阵\(A\)的所有特征值和特征向量。
特征值的英文名称为eigenvalue,其前缀“eigen”来自德语,本意为“自身的”,也可理解为“表征一种内在属性的”,因此也有一些学者将eigenvalue翻译为“本征值”。
在sage中,与特征值、特征多项式、特征向量相关的命令有如下几个:
三角型矩阵的特征值和特征多项式都很好求。
例 7.3.6.
上三角矩阵的特征多项式。
下一个例子说明在讨论特征值相关问题时,最好在复数域上进行。
例 7.3.7.
分别求矩阵\(A = \begin{pmatrix}
0 & 1\\
-1 & 0
\end{pmatrix}\)在实数域和复数域上的特征值和特征向量。
子节 7.3.2 特征值、特征向量的常用性质
我们先从特征多项式根的角度着手理解特征值性质。任意数域上多项式的根都可能是复数根(如
例 7.3.7 所示),所以讨论特征值相关问题时通常是放在复数域范围内讨论。另一方面,很多工程问题天然局限在实数域范围内,所以有时我们也讨论实数域下特征值、特征向量的相关问题。
命题 7.3.8.
设\(A\)是\(n\)阶方阵。则\(A\)的特征多项式\(\chi_A(\lambda)\)是一个\(n\)次首一多项式。若\(A\)是实方阵,则\(\chi_A(\lambda)\)是实系数多项式;若\(A\)是复方阵,则\(\chi_A(\lambda)\)是复系数多项式。
定理 7.3.9.
设\(A\)是\(n\)阶方阵, 记
\begin{equation*}
\chi_A(\lambda)=\det (\lambda E_n-A)=\lambda^n-a_{n-1}\lambda^{n-1}+\cdots +(-1)^na_0,
\end{equation*}
则
\begin{equation*}
a_{n-1}={\rm tr} (A),\ a_0=\det A.
\end{equation*}
证明.
推论 7.3.10.
若\(\lambda_1,\cdots ,\lambda_n\)是\(n\)阶方阵\(A\)的全部特征值, 则
\begin{equation*}
\det A=\lambda_1 \cdots \lambda_n,\ {\rm tr} (A)=\lambda_1+\cdots +\lambda_n.
\end{equation*}
推论 7.3.11.
设\(A\)是\(n\)阶方阵, 则\(A\)是可逆的充分必要条件是\(A\)的特征值全不为零。
在讲解矩阵乘法时,我们强调了两个矩阵的乘积\(AB\)与\(BA\)(假设都存在)通常不相等,下面的例子从特征值角度揭示了这两个积矩阵的内在联系。
例 7.3.12.
设\(A,\ B\)为\(n\)阶方阵,证明:\(\chi_{AB}(\lambda)=\chi_{BA}(\lambda)\)。
例 7.3.13.
设\(A\in\mathbb{F}^{m\times n},B\in\mathbb{F}^{n\times m}\)且\(m\geq n\)。证明:
\(\det (\lambda E_m-AB)=\lambda^{m-n}\det (\lambda E_n-BA)\);
\({\rm tr} (AB)={\rm tr} (BA)\)。
上述两个例子说明:\(AB\)与\(BA\)的非0特征值集合(按重数记的多重集)必定相同。
我们再来看一下转置运算对特征值的影响。
定理 7.3.14.
设\(A\)是\(n\)阶方阵, 则
\begin{equation*}
\chi_A(\lambda)=\chi_{A^T}(\lambda).
\end{equation*}
因而\(A\)与\(A\)的转置\(A^T\)有相同的特征值。
接下来讨论特征向量的常用基本性质。
定理 7.3.15.
数域\(\mathbb{F}\)上属于不同特征值的特征向量线性无关。
证明.
推论 7.3.16.
设\(n\)阶方阵\(A\)的不同特征值为\(\lambda_1,\dots ,\lambda_t\),齐次线性方程组\((\lambda_iE-A)x=0\)的基础解系为\(\eta_{i1},\dots,\eta_{is_i},(i=1,\dots ,t)\),则向量组
\begin{equation*}
\eta_{11},\dots,\eta_{1s_1},\eta_{21},\dots,\eta_{2s_2},\dots,\eta_{t1},\dots,\eta_{ts_t}
\end{equation*}
线性无关。即\(V_{\lambda_1}+V_{\lambda_2}+\cdots +V_{\lambda_t}\)是直和。
证明.
子节 7.3.4 矩阵的上三角化
在
例 7.3.6中,上三角矩阵的特征值就是它的所有对角元。接下来我们说明:在复数域上,任意方阵都可以经相似变换变成上三角矩阵。
定理 7.3.20.
设 \(A\in \C^{n\times n}\),则存在可逆矩阵\(P\in \C^{n\times n}\),使得 \(P^{-1}AP\)是上三角矩阵,且此时\(P^{-1}AP\)主对角线上元素就是 \(A\) 的所有特征值。
证明.
一般数域\(\mathbb{F}\)上的方阵\(A\)未必相似于\(\mathbb{F}\)上的上三角矩阵,主要原因是因为特征值可能会不落在\(\mathbb{F}\)内。事实上, 若\(A\)特征值全在\(\mathbb{F}\)中, 则在\(\mathbb{F}\)上\(A\)也可以相似于上三角矩阵。
推论 7.3.21.
设 \(A\in \F^{n\times n}\)。若\(A\)的所有特征值均属于\(\mathbb{F}\),则存在可逆矩阵\(P\in \F^{n\times n}\),使得 \(P^{-1}AP\)是上三角矩阵,且此时\(P^{-1}AP\)主对角线上元素就是 \(A\) 的所有特征值。
特别的,若实方阵\(A\)的特征值都是实数,则\(A\)实相似于上实上三角矩阵。
证明.
注意到上三角矩阵带入多项式中后获得的矩阵仍然是上三角矩阵,我们有下面一个常用结论
命题 7.3.22.
设\(A\)是数域\(\mathbb{F}\)上的\(n\)阶方阵,\(g(x)\in\mathbb{F} [x]\),证明:
若\(\lambda\)是\(A\)的特征值,则\(g(\lambda)\)是矩阵\(g(A)\)的特征值;
若\(\lambda_1,\lambda_2,\cdots ,\lambda_n\)是\(A\)的全部特征值, 则\(g(\lambda_1),g(\lambda_2),\cdots ,g(\lambda_n)\)是\(g(A)\)的全部特征值。
证明.
本小节中所有关于上三角矩阵的结论都可以平行推广至下三角矩阵,使用上三角矩阵只是一种习惯而已,二者没有本质区别。