主要内容

高等代数: 多项式与线性代数

7.1 线性变换与矩阵相似

在描述和研究一些变化过程时,我们可以把变化前后的所有元素都嵌入到同一个线性空间\(V\)中,相应的变化过程可以抽象描述为\(\varphi:V\to V,\ \alpha \mapsto \varphi(\alpha) \),即经过这个变化过程\(\varphi\)\(\alpha\)变成了\(\varphi(\alpha)\)。进一步地,若\(\varphi\)还满足线性性,则这样的\(\varphi\)就是我们接下来要讨论的主要对象。

子节 7.1.1 线性变换的概念与举例

定义 7.1.1.

\(V\)是一个数域\(\F\)上的线性空间,\(\varphi: V\to V \)\(V\)上的一个映射。若对任意\(\alpha,\beta\in V\),及任意\(c_1,c_2\in \F\)
\begin{equation*} \varphi(c_1\alpha_1+c_2\alpha_2) = c_1\varphi(\alpha_1)+c_2\varphi(\alpha_2), \end{equation*}
则称\(\varphi\)\(V\)上的一个线性变换
由定义可知,线性变换是特殊的线性映射。下面举一些常见的例子。

7.1.2. 方阵乘法.

\(V=\F^n\)时,取\(A\)是一个\(n\)阶方阵,则
\begin{equation*} \varphi_A: \F^n\to \F^n, \varphi_A(\alpha) =A\alpha, \forall \alpha\in \F^n \end{equation*}
是一个线性变换。
利用同构的思想和上一章中关于线性映射的理解,有限维空间中的线性变换都可以按方阵来理解,其作用效果相当于做了一次矩阵乘法。

7.1.3. 数乘变换、恒等变换、0变换.

\(c\in \F\)\(\varphi\)是将\(V\)任意元素\(\alpha\)变为\(c\alpha\)的映射,容易验证\(\varphi\)\(V\)上的线性变换,称为数乘变换,记为\(c{\rm id}_V\)
特别地,当\(c=0\)时,称对应的变换为零变换; 当\(c=1\)时,称对应的变换为恒等变换。恒等变换通常记为\({\rm id}\)(英文单词identity的前2个字母),0变换通常就简记为0.
数乘变换是最简单的一类线性变换,当\(V=\R^n \)时,这种变换从几何上也很容易理解,它的作用效果就是伸缩。

7.1.4. \(\R^2\)上的旋转.

作为例 7.1.2的一个特例,取\(V =\R^2\)\(A = \begin{pmatrix} \cos\theta & -\sin\theta\\ \sin\theta & \cos\theta \end{pmatrix}\)
\begin{equation*} \varphi_A: \R^2\to \R^2, \varphi_A(\alpha) =A\alpha, \forall \alpha\in \R^2, \end{equation*}
其中\(\theta\)是一个用弧度制表示的角度。则\(\varphi_A\)的作用效果相当于对坐标平面\(\R^2\)沿逆时针方向绕坐标原点旋转\(\theta\)角。
同学们可以借助下面的程序片段来理解旋转变换。

7.1.5. 投影变换.

\(V_1\)\(V_2\)是线性空间\(V\)的子空间,且\(V=V_1\oplus V_2\)。对任意\(v\in V\)有唯一的分解 \(v = v_1+v_2\),其中\(v_1\in V_1\)\(v_2\in V_2\),定义:
\begin{equation*} P: V \to V,\ P(v)=v_1. \end{equation*}
容易验证\(P\)\(V\)上的线性变换,称为这个变换为\(V\)\(V_1\)投影变换
接下来介绍一个与分析学有关的变换,从而可见线性变换这个概念含义的广泛性。

7.1.6. 求导变换.

\(V=D^{\infty}(a,b)\),即在开区间\((a,b)\)上无穷次可微函数全体构成的线性空间。对任意\(f(x)\in D^{\infty}(a,b)\),定义
\begin{equation*} {\rm D}: f(x)\mapsto f'(x), \end{equation*}
\({\rm D}\)\(D^{\infty}(a,b)\)上的线性变换。\({\rm D}\)也被称为微分算子
最后介绍一种矩阵空间上的重要线性变换。

7.1.7. Lie变换.

\(V=\F^{n\times n}\)\(A\)是一个给定的\(n\)阶方阵。对任意\(B\in \F^{n\times n}\),定义
\begin{equation*} {\rm ad}_A(B) = AB-BA, \end{equation*}
\({\rm ad}_A\)\(n\)阶方阵空间上的线性变换。

子节 7.1.2 线性变换的表示矩阵与相似

延续上一章中的思想,接下来我们将建立相对抽象的线性变换(特殊的线性映射)与相对具体的矩阵间的联系。
\(V\)是一个数域\(\F\)上的\(n\)维线性空间,\(\varphi: V\to V\)\(V\)上的线性变换。取定\(V\)的一个基\((\xi_1,\ldots,\xi_n)\),则\(\varphi\)由基中向量的像决定。注意到这些像仍在\(V\)中,因此一种自然的选择是仍用这个基\((\xi_1,\ldots,\xi_n)\)把这些像表示出来,获得相应的坐标。记
\begin{equation} \varphi(\xi_1,\ldots,\xi_n)=(\xi_1,\ldots,\xi_n)A,\tag{7.1.1} \end{equation}
其中\(A\)矩阵的第\(i\)列就是\(\varphi(\xi_{i})\)在基\((\xi_1,\ldots,\xi_n)\)下的坐标。称\(A\)为线性变换\(\varphi\)在基\((\xi_1,\ldots,\xi_n)\)下的表示矩阵

7.1.8.

\(V= \F_n[x]\)\(\varphi\)\(V\)上的求导变换,求\(\varphi\)在基 \((1,x,\dots,x^{n-1})\)下的表示矩阵,并利用表示矩阵演示\(\varphi\)的作用效果。
解答.
由于
\begin{equation*} \varphi(1)=0,\ \varphi (x^{k}) =kx^{k-1}, 1\leq k\leq n-1, \end{equation*}
所以\(\varphi(1),\varphi(x),\varphi(x^2),\ldots,\varphi (x^{n-1})\)在基\((1,x,\ldots ,x^{n-1})\)下的坐标分别为
\begin{equation*} \begin{pmatrix} 0\\0\\\vdots\\0\\0 \end{pmatrix},\begin{pmatrix} 1\\0\\\vdots\\0\\0 \end{pmatrix},\begin{pmatrix} 0\\2\\\vdots\\0\\0 \end{pmatrix},\ldots,\begin{pmatrix} 0\\0\\\vdots\\n-1\\0 \end{pmatrix}. \end{equation*}
因此\(\varphi\)在基\((1,x,\dots,x^{n-1})\)下的表示矩阵为
\begin{equation*} A=\begin{pmatrix} 0 & 1 & 0 & \cdots & 0\\ 0 & 0 & 2 & \cdots & 0\\ \vdots & \vdots & \vdots & \ddots & \vdots\\ 0 & 0 & 0 & \cdots & n-1\\ 0 & 0 & 0 & \cdots & 0 \end{pmatrix}. \end{equation*}
对任意\(f(x)=a_0+a_1x+\cdots+a_{n-1}x^{n-1}\in V\),有
\begin{equation*} \varphi\left(f(x)\right)=A\begin{pmatrix} a_0\\a_1\\\vdots\\a_{n-1} \end{pmatrix}. \end{equation*}
注意到线性变换\(\varphi\)本身和\(V\)空间基的选择是没有关系的,而\(\varphi\)的表示矩阵却与\(V\)的基选择有关,所以有下面一个自然问题。

问题 7.1.9.

对于同一个线性变换\(\varphi\)\(\varphi\)\(V\)两个不同基下的表示矩阵有什么关系?
我们有下面的结论。

证明.

由于
\begin{equation*} \varphi(\eta_1,\ldots,\eta_n)=(\eta_1,\ldots,\eta_n)B, \end{equation*}
同时
\begin{align*} \amp \varphi(\eta_1,\ldots,\eta_n) \\ = \amp \varphi((\xi_1,\ldots,\xi_n)P) \\ = \amp \varphi(\xi_1,\ldots,\xi_n)P \\ = \amp (\xi_1,\ldots,\xi_n)AP, \end{align*}
于是
\begin{align*} \amp (\eta_1,\ldots,\eta_n)B\\ = \amp (\xi_1,\ldots,\xi_n)AP \\ = \amp (\xi_1,\ldots,\xi_n)P\cdot P^{-1}AP \\ = \amp (\eta_1,\ldots,\eta_n)P^{-1}AP. \end{align*}
所以
\begin{equation*} B=P^{-1}AP. \end{equation*}
于是,有下面一个重要定义。

定义 7.1.11.

\(A\)\(B\in \mathbb{F}^{n\times n}\)。若存在可逆矩阵\(P\),使得
\begin{equation*} {\color{red} B=P^{-1}AP }, \end{equation*}
则称\(A\)相似\(B\),记作\(A\sim B\)
定理 7.1.10说明同一个线性变换在不同基下的矩阵是相似的。反之,若\(A\)\(B\)相似,则我们也可以认为\(A\)\(B\)是同一个线性变换在不同基下的矩阵。
相似是特殊的相抵。相似/相抵描述的都是同一个线性变换/映射在换基前后不同表示矩阵之间的关系。不同的是线性映射涉及到的两个线性空间可以是彼此无关的,相应的基变换过渡矩阵也可以彼此独立;而线性变换由于变换前后的空间是同一个空间,相应的基变换是相同的,于是乘在表示矩阵左右两侧的矩阵需要是互逆矩阵。
进一步易知下面的命题成立。
本章接下来的部分将围绕相似关系展开。我们关心:对于一个线性变换\(\varphi\),其“最简单”的表示矩阵会是什么形式的矩阵?
称从一个方阵\(A\)变成\(P^{-1}AP\)的过程为对\(A\)做了一次相似变换
与上述问题相关的矩阵问题是:对于一个给定的方阵\(A\),经过相似变换,\(A\)可以变成的“最简单”矩阵是什么形式的矩阵?这个问题也称为相似标准型问题。

子节 7.1.3 线性变换的整体性理解——代数

\(V\)是一个数域\(\F\)上的线性空间,用\(\mathcal{L}(V)\)表示\(V\)上所有线性变换所构成的集合,即\(\mathcal{L}(V)= \mathcal{L}(V,V)\)
由于线性变换是特殊的线性映射,所以\(\mathcal{L}(V)\)关于线性映射的加法和数乘运算封闭,且按照线性映射的加法、数乘运算仍构成数域\(\mathbb{F}\)上的线性空间。
与一般\(\mathcal{L}(V,U)\)不同,除了加法和数乘运算外,\(\mathcal{L}(V)\)中的线性变换都可以复合,且复合后仍是\(V\)上的线性变换,即\(\mathcal{L}(V)\)上有第三种运算:复合运算。可以验证 \(\mathcal{L}(V)\)中线性变换关于复合运算封闭,即对任意\(\varphi ,\psi\in\mathcal{L}(V)\),均有
\begin{equation*} \psi\varphi\in \mathcal{L}(V), \end{equation*}
\(\forall \varphi ,\psi ,\sigma\in\mathcal{L} (V), c\in\mathbb{F}\),有
  1. 复合结合律: \(\sigma (\psi\varphi)=(\sigma\psi)\varphi\)
  2. 复合与加法协调:\(\sigma(\psi+\varphi)=\sigma\psi+\sigma\varphi,(\sigma +\psi)\varphi=\sigma\varphi +\psi\varphi\)
  3. 复合与数乘协调:\((c\psi)\varphi=c(\psi\varphi)=\psi(c\varphi)\)
所以有下面的定义。

定义 7.1.13.

\(V\)\(\mathbb{F}\)的线性空间。如果在\(V\)上定义乘法“\(\circ\)”满足:
  1. 乘法结合律: \(\alpha\circ (\beta\circ\gamma)=(\alpha\circ \beta)\circ \gamma \)
  2. 乘法与加法协调: \(\alpha\circ (\beta+\gamma) = \alpha\circ \beta+\alpha\circ \gamma \)\((\alpha+ \beta)\circ \gamma = \alpha\circ \gamma+ \beta\circ \gamma \)
  3. 乘法与数乘协调: \(c(\alpha\circ \beta)=(c \alpha)\circ \beta = \alpha\circ(c \beta)\)
则称\(V\)\(\mathbb{F}\)上的代数。若还满足
  1. 存在单位元: 存在\(e\in V\)使得\(e\circ \alpha=\alpha\circ e=\alpha\)
则称\(V\)是带单位元\(e\)\(\mathbb{F}\)上代数。
若满足项 1项 2项 3外,还满足
  1. 乘法交换律: \(\alpha \circ \beta=\beta\circ \alpha\)
则称\(V\)\(\mathbb{F}\)上的交换代数 。不满足 项 I 的代数称为非交换代数
可知 \(\mathcal{L}(V)\)关于线性变换的加法、数乘和复合三种运算构成一个有单位元的非交换代数。
另外,数域\(\F\)\(n\)阶方阵全体\(\F^{n\times n}\)关于矩阵乘法也是封闭的。容易验证\(\F^{n\times n}\)关于矩阵加法、数乘和矩阵乘法也构成一个有单位元的非交换代数。
\(\mathcal{L}(V)\)\(\F\)\(n\)这两个表面上完全不同的非交换代数有着非常密切的联系。下面的定义和结论就是为了准确描述这种联系。

定义 7.1.14.

\(V\)\(U\)是数域\(\mathbb{F}\)上的两个代数,若存在线性空间同构映射\(\Theta: V\to U\),且满足
\begin{equation*} \Theta(\alpha\circ \beta) = \Theta(\alpha)\circ \Theta(\beta) \end{equation*}
则称\(\Theta\)\(\mathbb{F}\)上的代数同构映射 , 称\(V\)\(U \)代数同构
于是,有限维空间线性变换和方阵可以在上述同构意义下等同起来,每一个方阵都可以被认为是一个线性变换,每一个有限维空间上的线性变换也都可表示为一个方阵。与方阵相关的定义和结论也都可以移植给线性变换,反之亦可。这里我们列出一些有代表性的推论。
类似于可逆矩阵,在线性变换中,可逆线性变换具有特别重要的地位。 \(V\)上的可逆线性变换本身也是为\(V\)\(V\)的同构映射,这种同构映射也被称之为\(V\)上的自同构。根据 **第6章定理单等同于列满秩,满等同于行满秩**,有下面的推论。

练习 7.1.4 练习

基础题.

1.
验证相似关系是等价关系。
2.
\(A={\rm{diag}}(a_1,a_2,\cdots ,a_n)\),定义\(\mathbb{F}^{n\times n}\)上线性变换
\begin{equation*} \varphi:\mathbb{F}^{n\times n}\to\mathbb{F}^{n\times n},\ X\mapsto AX-XA, \end{equation*}
验证:\(\varphi\)\(\mathbb{F}^{n\times n}\)的标准基\(\{E_{ij}\ |\ 1\leq i,j\leq n\}\)下的矩阵也是对角矩阵。
解答.
因为\(\varphi(E_{ij})=AE_{ij}-E_{ij}A=(a_i-a_j)E_{ij}\),所以\(\varphi\)在基\(E_{11},\cdots,E_{1n},E_{21},\cdots ,E_{2n},\cdots ,E_{n1},\cdots ,E_{nn}\)下的矩阵为对角矩阵
\begin{equation*} \begin{pmatrix} a_1-a_1&&&&&&&&&\\ &\ddots&&&&&&&&\\ &&a_1-a_n&&&&&&&\\ &&&a_2-a_1&&&&&&\\ &&&&\ddots&&&&&\\ &&&&&a_2-a_n&&&&\\ &&&&&&\ddots&&&\\ &&&&&&&a_n-a_1&&\\ &&&&&&&&\ddots&\\ &&&&&&&&&a_n-a_n \end{pmatrix}. \end{equation*}
3.
设线性变换\(\varphi:\mathbb{F}^3\rightarrow \mathbb{F}^3, \ (a,b,c)^T\mapsto (a,a+b,a+b+c)^T\)
  1. \(\varphi\)在基\(\varepsilon_1,\varepsilon_2,\varepsilon_3\)下的矩阵;
  2. \(\varphi\)在基\(\varepsilon_2,\varepsilon_3,\varepsilon_1\)下的矩阵;
  3. \(\varphi\)在基\(\varepsilon_1+\varepsilon_2,\varepsilon_2+\varepsilon_3,\varepsilon_3+\varepsilon_1\)下的矩阵;
  4. 证明:\(\varphi\)可逆,并求出\(\varphi^{-1}\)
  5. \(2\varphi-\varphi^{-1}\)在基\(\varepsilon_1,\varepsilon_2,\varepsilon_3\)下的矩阵。
解答.
  1. 因为\(\varphi (\varepsilon_1)=\varepsilon_1+\varepsilon_2+\varepsilon_3,\varphi (\varepsilon_2)=\varepsilon_2+\varepsilon_3,\varphi (\varepsilon_3)=\varepsilon_3\),所以
    \begin{equation*} \varphi (\varepsilon_1,\varepsilon_2,\varepsilon_3)=(\varepsilon_1,\varepsilon_2,\varepsilon_3) \begin{pmatrix} 1&0&0\\ 1&1&0\\ 1&1&1 \end{pmatrix} , \end{equation*}
    \(\varphi\)在基\(\varepsilon_1,\varepsilon_2,\varepsilon_3\)下的矩阵为\(A= \begin{pmatrix} 1&0&0\\ 1&1&0\\ 1&1&1 \end{pmatrix}\)
  2. 解法一: 因为\(\varphi (\varepsilon_2)=\varepsilon_2+\varepsilon_3,\varphi (\varepsilon_3)=\varepsilon_3,\varphi (\varepsilon_1)=\varepsilon_2+\varepsilon_3+\varepsilon_1,\),所以
    \begin{equation*} \varphi (\varepsilon_1,\varepsilon_2,\varepsilon_3)=(\varepsilon_1,\varepsilon_2,\varepsilon_3) \begin{pmatrix} 1&0&1\\ 1&1&1\\ 0&0&1 \end{pmatrix} , \end{equation*}
    \(\varphi\)在基\(\varepsilon_2,\varepsilon_3,\varepsilon_1\)下的矩阵为\(B= \begin{pmatrix} 1&0&1\\ 1&1&1\\ 0&0&1\end{pmatrix}\)
    解法二: 因为\((\varepsilon_2,\varepsilon_3,\varepsilon_1)=(\varepsilon_1,\varepsilon_2,\varepsilon_3)P\),其中
    \begin{equation*} P= \begin{pmatrix} 0&0&1\\ 1&0&0\\ 0&1&0 \end{pmatrix}, \end{equation*}
    所以\(\varphi\)在基\(\varepsilon_2,\varepsilon_3,\varepsilon_1\)下的矩阵为
    \begin{equation*} B=P^{-1}AP=\begin{pmatrix} 1&0&1\\ 1&1&1\\ 0&0&1 \end{pmatrix}. \end{equation*}
  3. 因为\((\varepsilon_1+\varepsilon_2,\varepsilon_2+\varepsilon_3,\varepsilon_3+\varepsilon_1)=(\varepsilon_1,\varepsilon_2,\varepsilon_3)Q\),其中
    \begin{equation*} Q= \begin{pmatrix} 1&0&1\\ 1&1&0\\ 0&1&1 \end{pmatrix}, \end{equation*}
    所以\(\varphi\)在基\(\varepsilon_1+\varepsilon_2,\varepsilon_2+\varepsilon_3,\varepsilon_3+\varepsilon_1\)下的矩阵为
    \begin{equation*} C=Q^{-1}AQ=\begin{pmatrix} \frac{1}{2}&-\frac{1}{2}&0\\ \frac{3}{2}&\frac{3}{2}&1\\ \frac{1}{2}&\frac{1}{2}&1 \end{pmatrix}. \end{equation*}
  4. 因为
    \begin{equation*} \varphi (\varepsilon_1,\varepsilon_2,\varepsilon_3)=(\varepsilon_1,\varepsilon_2,\varepsilon_3)A, \end{equation*}
    其中\(A= \begin{pmatrix} 1&0&0\\ 1&1&0\\ 1&1&1 \end{pmatrix}\)是可逆矩阵,所以\(\varphi\)可逆,且\(\varphi^{-1}\)满足
    \begin{equation*} \varphi^{-1}(\varepsilon_1,\varepsilon_2,\varepsilon_3)=(\varepsilon_1,\varepsilon_2,\varepsilon_3)A^{-1}=(\varepsilon_1,\varepsilon_2,\varepsilon_3) \begin{pmatrix} 1&0&0\\-1&1&0\\0&-1&1 \end{pmatrix}, \end{equation*}
    \begin{equation*} \varphi^{-1}:\mathbb{F}^3\rightarrow\mathbb{F}^3,\ (a,b,c)^T\mapsto (a,b-a,c-b)^T. \end{equation*}
  5. \(2\varphi-\varphi^{-1}\)在基\(\varepsilon_1,\varepsilon_2,\varepsilon_3\)下的矩阵为
    \begin{equation*} 2A-A^{-1}=\begin{pmatrix} 1&0&0\\ 3&1&0\\ 2&3&1 \end{pmatrix}. \end{equation*}
4.
证明:多项式集合 \(\F[x]\)关于多项式加法,数乘和乘法三种运算构成一个有单位元的交换代数,且多项式代数与矩阵代数及线性变换代数都不同构。

提高题.

5.
\(A,B\)是数域\(\F\)\(n\)阶方阵。
  1. 证明:若\(A\)可逆,则\(AB\)相似于\(BA\)
  2. 举例说明对一般的\(n\)阶方阵\(A,B\),矩阵\(AB\)未必相似于\(BA\)
解答.
因为存在可逆矩阵\(A\),使得
\begin{equation*} BA=A^{-1}(AB)A, \end{equation*}
所以\(AB\)相似于\(BA\)
6.
\(A\)相似于\(B\)\(C\)相似于\(D\),证明:\(\begin{pmatrix} A&0\\0&C \end{pmatrix}\)相似于\(\begin{pmatrix} B&0\\0&D \end{pmatrix}\)
解答.
因为\(A\)相似于\(B\)\(C\)相似于\(D\),所以存在可逆矩阵\(P\)\(Q\)使得
\begin{equation*} B=P^{-1}AP,D=Q^{-1}CQ. \end{equation*}
\(R= \begin{pmatrix} P&0\\0&Q \end{pmatrix}\),则\(R\)可逆且
\begin{equation*} \begin{array}{rcl} R^{-1}\begin{pmatrix} A&0\\0&C \end{pmatrix}R & = &\begin{pmatrix} P&0\\0&Q \end{pmatrix}^{-1}\begin{pmatrix} A&0\\0&C \end{pmatrix}\begin{pmatrix} P&0\\0&Q \end{pmatrix}\\ &=&\begin{pmatrix} P^{-1}AP&0\\0&Q^{-1}CQ \end{pmatrix}=\begin{pmatrix} B&0\\0&D \end{pmatrix}.\end{array} \end{equation*}
7.
\(A\)相似于\(B\),证明:对任意正整数\(m\)和任意\(c\in\mathbb{F}\),有
  1. \(A^m\)相似于\(B^m\)
  2. \(cA\)相似于\(cB\)
  3. \(A^T\)相似于\(B^T\)
  4. \(\det A=\det B\)
  5. tr\((A)=\)tr\((B)\)
  6. \(A\)可逆当且仅当\(B\)可逆,且\(A^{-1}\)相似于\(B^{-1}\)
  7. \(A^2=A\)当且仅当\(B^2=B\)
解答.
因为\(A\)相似于\(B\),所以存在可逆矩阵\(P\),使得\(B=P^{-1}AP\)
  1. \(B^m=(P^{-1}AP)(P^{-1}AP)\cdots (P^{-1}AP)=P^{-1}A^mP\),故\(A^m\)相似于\(B^m\)
  2. \(cB=c(P^{-1}AP)=P^{-1}(cA)P\),故\(cA\)相似于\(cB\)
  3. \(B^T=(P^{-1}AP)^T=P^TA^T\left(P^{-1}\right)^T=P^TA^T\left(P^T\right)^{-1}\),故\(A^T\)相似于\(B^T\)
  4. \(\det B=\det\left(P^{-1}AP\right)=\det P^{-1}\det A\det P=\det A\)
  5. \(tr(B)=tr\left(P^{-1}AP\right)=tr\left((AP)P^{-1}\right)=tr(A)\)
  6. 因为\(\det B=\det A\),所以\(\det A\neq 0\)当且仅当\(\det B\neq 0\),即\(A\)可逆当且仅当\(B\)可逆。
  7. 因为\(B=P^{-1}AP,\ B^2=P^{-1}A^2P\),所以
    \begin{equation*} B^2=B\Leftrightarrow P^{-1}A^2P=P^{-1}AP\Leftrightarrow A^2=A. \end{equation*}
8.
\(\varphi\)是数域\(\F\)\(n\)维线性空间\(V\)上线性变换。证明:如果\(\varphi\)\(V\)的任意一个基下的矩阵都相同,则\(\varphi\)是数乘变换,即存在\(c\in\F\),使得 \(\varphi=c{\rm id}_V\)
解答.
  1. 对任意\(m\in\mathbb{Z}^+,\alpha\in{ m Ker}\varphi^m\),有\(\varphi^m(\alpha)=0\),则
    \begin{equation*} \varphi^{m+1}(\alpha)=\varphi(\varphi^m(\alpha))=\varphi(0)=0. \end{equation*}
    \({ m Ker}\varphi^m\subseteq{ m Ker}\varphi^{m+1}\)
  2. 对任意\(m\in\mathbb{Z}^+\),下证\({\rm Im}\varphi^m\supseteq{\rm Im}\varphi^{m+1}\)。对任意\(\beta\in{\rm Im}\varphi^{m+1}\),存在\(\alpha\in V\),使得\(\beta=\varphi^{m+1}(\alpha)\),则
    \begin{equation*} \beta=\varphi^m(\varphi(\alpha))\in{\rm Im}\varphi^m. \end{equation*}
    从而\({\rm Im}\varphi^m\supseteq{\rm Im}\varphi^{m+1}\)
  3. \({\rm Ker}\varphi^m\neq{\rm Ker}\varphi^{m+1}\)的充要条件是\(\dim{\rm Ker}\varphi^m<\dim{\rm Ker}\varphi^{m+1}\)。因为\(V\)是有限维线性空间,所以\((1)\)中的包含关系不可能全部是真包含。故存在正整数\(s\),使得\({\rm Ker}\varphi^s={\rm Ker}\varphi^{s+1}\)
  4. \({\rm Im}\varphi^m\neq{\rm Im}\varphi^{m+1}\)的充要条件是\(\dim{\rm Im}\varphi^m>\dim{\rm Im}\varphi^{m+1}\)。因为\(V\)是有限维线性空间,所以\((2)\)中的包含关系不可能全部是真包含。故存在正整数\(t\),使得\({\rm Im}\varphi^t={\rm Im}\varphi^{t+1}\)
  5. 我们只需证明对任意\(j>s\),总有\({\rm Ker}\varphi^j={\rm Ker}\varphi^{j+1}\)。事实上,对任意\(\alpha\in{\rm Ker}\varphi^{j+1}\),有\(\varphi^{j+1}(\alpha)=0\),即\(\varphi^{s+1}(\varphi^{j-s}(\alpha))=0\),则\(\varphi^{j-s}(\alpha)\in{\rm Ker}\varphi^{s+1}\)。注意到\({\rm Ker}\varphi^s={\rm Ker}\varphi^{s+1}\),所以\(\varphi^{j-s}(\alpha)\in{\rm Ker}\varphi^s\)。因而
    \begin{equation*} 0=\varphi^s(\varphi^{j-s}(\alpha))=\varphi^j(\alpha), \end{equation*}
    这说明\(\alpha\in\varphi^j\),即\({\rm Ker}\varphi^{j+1}\subseteq{\rm Ker}\varphi^j\)。由结论\((1)\),有\({\rm Ker}\varphi^{j}\subseteq{\rm Ker}\varphi^{j+1}\),因此\({\rm Ker}\varphi^j={\rm Ker}\varphi^{j+1}\)。从而,
    \begin{equation*} {\rm Ker}\varphi^s={\rm Ker}\varphi^{s+1}={\rm Ker}\varphi^{s+2}=\cdots={\rm Ker}\varphi^{s+i}=\cdots . \end{equation*}
  6. 我们只需证明对任意\(j>t\),总有\({\rm Im}\varphi^j={\rm Im}\varphi^{j+1}\)。事实上,对任意\(\alpha\in{\rm Im}\varphi^{j}\),存在\(\beta\in V\),使得\(\alpha=\varphi^{j}(\beta)\),即\(\alpha=\varphi^{j-t}(\varphi^t(\beta))\)。注意到\(\varphi^t(\beta)\in{\rm Im}\varphi^t\)\({\rm Im}\varphi^{t}={\rm Im}\varphi^{t+1}\),所以存在\(\gamma\in V\),使得\(\varphi^t(\beta)=\varphi^{t+1}(\gamma)\)。因而
    \begin{equation*} \alpha=\varphi^{j-t}(\varphi^{t+1}(\gamma))=\varphi^{j+1}(\gamma)\in{\rm Im}\varphi^{j+1}, \end{equation*}
    这说明\({\rm Im}\varphi^{j}\subseteq{\rm Im}\varphi^{j+1}\)。由结论\((2)\),有\({\rm Im}\varphi^{j+1}\subseteq{\rm Im}\varphi^{j}\),因此\({\rm Im}\varphi^j={\rm Im}\varphi^{j+1}\)。从而,
    \begin{equation*} {\rm Im}\varphi^t={\rm Im}\varphi^{t+1}={\rm Im}\varphi^{t+2}=\cdots={\rm Im}\varphi^{t+i}=\cdots . \end{equation*}
  7. 根据维数公式
    \begin{equation*} \dim{\rm Ker}\varphi^s+\dim{\rm Im}\varphi^s=\dim V=\dim{\rm Ker}\varphi^{s+1}+\dim{\rm Im}\varphi^{s+1}, \end{equation*}
    结合\({\rm Ker}\varphi^s\subseteq{\rm Ker}\varphi^{s+1}\)\({\rm Im}\varphi^s\supseteq{\rm Im}\varphi^{s+1}\),得到
    \begin{equation*} \begin{array}{ccl}{\rm Ker}\varphi^s={\rm Ker}\varphi^{s+1}&\Leftrightarrow&\dim{\rm Ker}\varphi^s=\dim{\rm Ker}\varphi^{s+1}\\ &\Leftrightarrow&\dim{\rm Im}\varphi^s=\dim{\rm Im}\varphi^{s+1}\\ &\Leftrightarrow&{\rm Im}\varphi^s={\rm Im}\varphi^{s+1}. \end{array} \end{equation*}
  8. 因为\({\rm Ker}\varphi^s={\rm Ker}\varphi^{s+1}\),所以由\((5),(6),(7)\)
    \begin{equation*} {\rm Ker}\varphi^s={\rm Ker}\varphi^{2s},{\rm Im}\varphi^s={\rm Im}\varphi^{2s}. \end{equation*}
    对任意\(\alpha\in V\)\(\varphi ^s(\alpha)\in{\rm Im}\varphi^s\),所以存在\(\beta\in V\)使得\(\varphi ^s(\alpha)=\varphi^{2s}(\beta)\),则
    \begin{equation*} \alpha=\varphi^s(\beta)+(\alpha-\varphi^s(\beta)), \end{equation*}
    这里
    \begin{equation*} \varphi^s(\alpha-\varphi^s(\beta))=\varphi^s(\alpha)-\varphi^{2s}(\beta)=0, \end{equation*}
    \(\alpha-\varphi^s(\beta)\in{\rm Ker}\varphi^s\)。而\(\varphi^s(\beta)\in{\rm Im}\varphi^s\),故\(V={\rm Ker}\varphi^s+{\rm Im}\varphi^s\)
    对任意\(\alpha\in{\rm Ker}\varphi^s\bigcap{\rm Im}\varphi^s\),存在\(\beta\in V\)使得\(\alpha=\varphi^s(\beta)\)。又\(\varphi^s(\alpha)=0\),所以
    \begin{equation*} 0=\varphi^s(\varphi^s(\beta))=\varphi^{2s}(\beta), \end{equation*}
    \(\beta\in{\rm Ker}\varphi^{2s}={\rm Ker}\varphi^{s}\)。于是\(\alpha=\varphi^s(\beta)=0\),即\({\rm Ker}\varphi^s\bigcap{\rm Im}\varphi^s=0\)
    综上,\(V={\rm Ker}\varphi^s\oplus{\rm Im}\varphi^s\)
9.
\(V\)是数域\(\F\)\(n\)维线性空间,是否存在\(V\)上线性变换\(\varphi,\psi\)使得 \(\varphi\psi-\psi\varphi={\rm id}_V\)?若是,请给出例子;若否,请加以证明。
对于数域\(\F\)上无限维线性空间,上述结论是否成立?
10.
\(\varphi\)是线性空间\(V\)上的线性变换,\(\alpha\in V\)。若存在正整数\(k\),使得
\begin{equation*} \varphi^{k-1}(\alpha)\neq 0,\varphi^k (\alpha)=0, \end{equation*}
证明:向量组\(\alpha,\varphi(\alpha),\cdots,\varphi^{k-1}(\alpha)\)线性无关。
解答.
\begin{equation*} a_0\alpha+a_1\varphi (\alpha)+\cdots +a_{k-1}\varphi^{k-1}(\alpha)=0, \end{equation*}
由于\(\varphi^k (\alpha)=0\),所以两边作用\(\varphi^{k-1}\)
\begin{equation*} a_0\varphi^{k-1}(\alpha)=0. \end{equation*}
注意到\(\varphi^{k-1}(\alpha)\neq 0\),所以\(a_0=0\)。于是,
\begin{equation*} a_1\varphi (\alpha)+\cdots +a_{k-1}\varphi^{k-1}(\alpha)=0, \end{equation*}
两边作用\(\varphi^{k-2}\),得\(a_1=0\)。依此类推,可得\(a_0=a_1=\cdots =a_{k-1}=0\)。故\(\alpha ,\varphi (\alpha), \cdots ,\varphi^{k-1}(\alpha)\)线性无关。
11.
\(V\)是数域\(\mathbb{F}\)\(n\)维线性空间,\(\alpha_1,\dots,\alpha_n\)\(V\)的一个基,定义\(V\)上的线性变换使得
\begin{equation*} \varphi(\alpha_i)=\alpha_{i+1}(i=1,\dots,n-1),\varphi(\alpha_n)=0, \end{equation*}
  1. \(\varphi\)在基\(\alpha_1,\cdots ,\alpha_n\)下的矩阵\(A\)
  2. 证明:\(\varphi^{n}=0,\varphi^{n-1}\neq 0\)
  3. \(\psi\)\(V\)上线性变换且满足\(\psi^n=0,\psi^{n-1}\neq 0\),证明:存在\(V\)的一个基\(\beta_1,\dots ,\beta_n\),使得\(\psi\)在这个基下的矩阵也是\(A\)
解答.
  1. 因为
    \begin{equation*} \varphi(\alpha_1,\alpha_2,\cdots ,\alpha_n)=(\alpha_1,\alpha_2,\cdots ,\alpha_n)\begin{pmatrix} 0&0&\cdots&0&0\\ 1&0&\cdots&0&0\\ 0&1&\cdots&0&0\\ \vdots&\vdots&\ddots&\vdots&\vdots\\ 0&0&\cdots&1&0 \end{pmatrix}, \end{equation*}
    所以\(\varphi\)在基\(\alpha_1,\alpha_2,\cdots ,\alpha_n\)下的矩阵\(A=\begin{pmatrix} 0&0&\cdots&0&0\\ 1&0&\cdots&0&0\\ 0&1&\cdots&0&0\\ \vdots&\vdots&\ddots&\vdots&\vdots\\ 0&0&\cdots&1&0 \end{pmatrix}\)
  2. 因为\(\varphi^{n}\)\(\varphi^{n-1}\)在基\(\alpha_1,\alpha_2,\cdots ,\alpha_n\)下的矩阵分别为\(A^n\)\(A^{n-1}\),而
    \begin{equation*} A^n=0,A^{n-1}=\begin{pmatrix} 0&\cdots&0&0\\ 0&\cdots&0&0\\ \vdots&\ddots&\vdots&\vdots\\ 1&\cdots&0&0 \end{pmatrix}\neq 0, \end{equation*}
    \(\varphi^{n}=0,\varphi^{n-1}\neq 0\)
  3. 因为\(\psi^{n-1}\neq 0\),所以存在\(\alpha\in V\)使得\(\psi^{n-1}(\alpha)\neq 0\)。由第1题结论知向量组
    \begin{equation*} \alpha,\psi(\alpha),\cdots ,\psi^{n-1}(\alpha) \end{equation*}
    线性无关。注意到\(\dim V=n\),故\(\alpha ,\psi (\alpha), \cdots ,\psi^{n-1}(\alpha)\)\(V\)的一个基。令
    \begin{equation*} \beta_1=\alpha,\beta_2=\psi(\alpha),\cdots ,\beta_n=\psi^{n-1}(\alpha), \end{equation*}
    \(\beta_1,\beta_2,\cdots ,\beta_n\)\(V\)的一个基,且
    \begin{equation*} \psi (\beta_1 ,\beta_2, \cdots ,\beta_n)=(\psi(\alpha),\psi^2(\alpha),\cdots ,\psi^{n-1}(\alpha),0)=(\beta_2, \beta_3,\cdots ,\beta_n,0). \end{equation*}
    \(\psi\)在基\(\beta_1 ,\beta_2, \cdots ,\beta_n\)下的矩阵也是
    \begin{equation*} A=\begin{pmatrix} 0&0&\cdots&0&0\\ 1&0&\cdots&0&0\\ 0&1&\cdots&0&0\\ \vdots&\vdots& &\vdots&\vdots\\ 0&0&\cdots&1&0 \end{pmatrix}. \end{equation*}
12.
\(\varphi,\psi\)都是\(V\)上幂等变换,即\(\varphi^2=\varphi,\psi^2=\psi\),证明:\(\varphi+\psi\)是幂等变换的充分必要条件是\(\varphi\psi=\psi\varphi=0\)
解答.
充分性:因为\(\varphi^2=\varphi,\psi^2=\psi,\varphi\psi=\psi\varphi=0\),所以
\begin{equation*} (\varphi+\psi)^2=\varphi^2+\varphi\psi+\psi\varphi+\psi^2=\varphi+\psi, \end{equation*}
\(\varphi+\psi\)是幂等变换。
必要性:因为\(\varphi+\psi=(\varphi+\psi)^2\),即\(\varphi+\psi=\varphi^2+\varphi\psi+\psi\varphi+\psi^2\),又\(\varphi^2=\varphi,\psi^2=\psi\),故
\begin{equation} \varphi\psi+\psi\varphi=0.\tag{7.1.2} \end{equation}
两边同时左乘\(\varphi\),得\(\varphi^2\psi+\varphi\psi\varphi=0\),即
\begin{equation} \varphi\psi+\varphi\psi\varphi=0\tag{7.1.3} \end{equation}
两边同时右乘\(\varphi\),得\(\varphi\psi\varphi+\psi\varphi^2=0\),即
\begin{equation} \varphi\psi\varphi+\psi\varphi=0\tag{7.1.4} \end{equation}
(7.1.3)\(-\)(7.1.4)得,
\begin{equation} \varphi\psi-\psi\varphi=0\tag{7.1.5} \end{equation}
于是,由(7.1.2)\(+\)(7.1.5)(7.1.3)\(-\)(7.1.4)\(\varphi\psi=\psi\varphi=0\)
13.
\(A,B\in\mathbb{F}^{n\times n}\),定义线性变换\(\varphi:\mathbb{F}^{n\times n}\rightarrow\mathbb{F}^{n\times n},\ X\mapsto AXB\),证明:\(\varphi\)是可逆变换的充分必要条件是\(A,B\)为可逆矩阵。
解答.
对任意\(X,Y\in\mathbb{F}^{n\times n},a,b\in\mathbb{F}\),有
\begin{equation*} \varphi (aX+bY)=A(aX+bY)B=a(AXB)+b(AYB)=a \varphi(X)+b\varphi (Y), \end{equation*}
\(\varphi\)\(\mathbb{F}^{n\times n}\)上的线性变换。
充分性:因\(A,B\)都是可逆矩阵,所以可定义\(\mathbb{F}^{n\times n}\)上的变换\(\psi\)如下:
\begin{equation*} \psi:\mathbb{F}^{n\times n}\rightarrow\mathbb{F}^{n\times n},\ X\mapsto A^{-1}XB^{-1}. \end{equation*}
对任意\(X\in\mathbb{F}^{n\times n}\),有
\begin{equation*} \begin{array}{c}\varphi\psi(X)=\varphi( A^{-1}XB^{-1})=A( A^{-1}XB^{-1})B=X,\\ \psi\varphi (X)=\psi(AXB)=A^{-1}(AXB)B^{-1}=X,\end{array} \end{equation*}
\(\varphi\psi=id_{\mathbb{F}^{n\times n}},\psi\varphi=id_{\mathbb{F}^{n\times n}}\),故\(\varphi\)可逆。又\(\varphi\)是线性变换,故\(\varphi\)是线性同构。
必要性:由于\(\varphi\)是满射,所以存在\(X\in\mathbb{F}^{n\times n}\)使得\(\varphi(X)=E_n\),即\(AXB=E_n\)。因此\(n\)阶方阵\(A,B\)都是可逆矩阵,且\(A^{-1}=XB,B^{-1}=AX\)

挑战题.

14.
给定\(n\)阶方阵\(A=\begin{pmatrix} \lambda_0&1&&&\\ &\lambda_0&1&&\\ &&\ddots&\ddots&\\ &&&\ddots&1\\ &&&&\lambda_0 \end{pmatrix}\),证明:\(A\)相似于\(A^T\),并求可逆矩阵\(P\)使得\(A^T=P^{-1}AP\)
解答.
证法一:定义线性变换\(\varphi:\mathbb{F}^n\rightarrow\mathbb{F}^n,\ X\mapsto AX\),则
\begin{equation*} \varphi(\varepsilon_1,\varepsilon_2,\cdots ,\varepsilon_n)=(\varepsilon_1,\varepsilon_2,\cdots ,\varepsilon_n)A, \end{equation*}
\(\varphi(\varepsilon_1)=\lambda_0\varepsilon_1,\varphi(\varepsilon_2)=\varepsilon_1+\lambda_0\varepsilon_2,\varphi(\varepsilon_3)=\varepsilon_2+\lambda_0\varepsilon_3,\cdots ,\varphi(\varepsilon_n)=\varepsilon_{n-1}+\lambda_0\varepsilon_n,\)
\begin{equation*} \varphi(\varepsilon_n,\varepsilon_{n-1},\cdots ,\varepsilon_2,\varepsilon_1)=(\varepsilon_n,\varepsilon_{n-1},\cdots ,\varepsilon_2,\varepsilon_1) \begin{pmatrix} \lambda_0&&&&\\ 1&\lambda_0&&&\\ &1&\ddots&&\\ &&\ddots&\ddots&\\ &&&1&\lambda_0 \end{pmatrix}. \end{equation*}
因此\(\varphi\)在基\(\varepsilon_1,\varepsilon_2,\cdots ,\varepsilon_n\)下的矩阵为\(A\),而在基\(\varepsilon_n,\varepsilon_{n-1},\cdots ,\varepsilon_1\)下的矩阵为\(A^T\)。从而,\(A\)相似于\(A^T\)
注意到\((\varepsilon_n,\varepsilon_{n-1},\cdots ,\varepsilon_1)=(\varepsilon_1,\varepsilon_2,\cdots ,\varepsilon_n)P\),其中
\begin{equation*} P= \begin{pmatrix} 0&0&\cdots&0&1\\ 0&0&\cdots&1&0\\ \vdots&\vdots&\ddots&\vdots&\vdots\\ 0&1&\cdots&0&0\\ 1&0&\cdots&0&0 \end{pmatrix}, \end{equation*}
所以\(A^T=P^{-1}AP\)
证法二:令
\begin{equation*} P= \begin{pmatrix} 0&0&\cdots&0&1\\ 0&0&\cdots&1&0\\ \vdots&\vdots&\ddots&\vdots&\vdots\\ 0&1&\cdots&0&0\\ 1&0&\cdots&0&0 \end{pmatrix}, \end{equation*}
\(P\)可逆,且\(P^{-1}AP=A^T\)。因此\(A\)相似于\(A^T\)