定义 8.3.1. 设 \(A,B\in \C^{n\times n}\)。若存在酉矩阵 \(U\)使得 \begin{equation*} B = U^{-1}AU = U^HAU, \end{equation*} 则称\(A\)与\(B\)酉相似。 🔗 🔗
取\(A ={\rm diag}(\lambda_1,\dots,\lambda_t) \),其中\(\lambda_1,\dots,\lambda_t\)互不相同;取\(B = P^{-1}AP \)。当\(P\)的列向量组不是正交向量组时\(A\)与\(B\)相似但不是正交相似。这是因为\(A\)的特征子空间分解将空间分为\(t\)个两两正交的特征子空间的直和,而\(B\)的特征子空间分解中存在不相互正交的特征子空间。🔗 🔗
对复方阵\(A\)的阶数\(n\)作归纳法。🔗 当\(n=1\)时,结论显然成立。🔗 假设对\(n-1\)阶复方阵结论成立,以下考虑\(n\)阶复方阵\(A\)。由于\(A\)是复方阵,根据代数学基本定理,\(A\)存在特征值\(\lambda_1\in\mathbb{C}\)。设\(X_1\in\mathbb{C}^n\)是\(A\)属于\(\lambda_1\)的单位特征向量,可将其扩充为\(\C^n\)的一个标准正交基\((X_1,\ldots,X_n)\)。将该标准正交基中的向量按列拼成一个矩阵,记 \begin{equation*} U_1=(X_1,\ldots,X_n), \end{equation*} 根据定理 8.2.16,\(U_1\)是酉矩阵。根据定义可知 \begin{equation*} A(X_1,\ldots,X_n)=(X_1,\ldots,X_n)\begin{pmatrix} \lambda_1 & *\\ 0 & A_1 \end{pmatrix}, \end{equation*} 其中\(A_1\)是\(n-1\)阶复方阵,即 \begin{equation*} U_1^{-1}AU_1=\begin{pmatrix} \lambda_1 & *\\ 0 & A_1 \end{pmatrix}. \end{equation*} 由归纳假设,存在\(n-1\)阶酉矩阵\(U_2\),使得\(U_2^{-1}A_1U_2\)为上三角矩阵,不妨记 \begin{equation*} U_2^{-1}A_1U_2=\begin{pmatrix} \lambda_2 & & *\\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix}. \end{equation*} 取\(U=U_1\begin{pmatrix} 1 & 0\\ 0 & U_2 \end{pmatrix}\),则\(U\)是\(n\)阶酉矩阵,且 \begin{equation*} U^{-1}AU=\begin{pmatrix} \lambda_1 & *\\ 0 & U_2^{-1}A_1U_2 \end{pmatrix}=\begin{pmatrix} \lambda_1 & & *\\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix} \end{equation*} 是上三角矩阵,结论成立。 🔗 证法二:由于\(A\)为复方阵,所以由定理 7.3.20,存在\(n\)阶可逆复矩阵\(P\),使得 \begin{equation*} P^{-1}AP = \begin{pmatrix} \lambda_1 & & * \\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix} \end{equation*} 为上三角矩阵。将可逆矩阵\(P\)作QR分解,存在酉矩阵\(U\)及对角元均大于0的上三角矩阵\(R\),使得\(P=UR\)。则 \begin{equation*} U^{-1}AU=R(P^{-1}AP)R^{-1}. \end{equation*} 由于\(P^{-1}AP,R,R^{-1}\)都是上三角矩阵,所以乘积矩阵\(R(P^{-1}AP)R^{-1}\)仍为上三角矩阵,即\(U^{-1}AU\)是上三角矩阵,结论成立。 🔗 🔗
定理 8.3.4. 设\(A\)是\(n\)阶酉矩阵,则存在\(n\)阶酉矩阵\(U\),使得 \begin{equation*} U^{-1}AU=U^HAU \end{equation*} 为对角矩阵,且主对角元都是模为\(1\)的复数。 🔗 等价地,设\(\phi\)是\(n\)维酉空间的酉变换,则存在一个标准正交基,使得\(\phi\)在此基下的矩阵是对角矩阵,且主对角元都是模为\(1\)的复数。🔗 🔗
根据定理 8.3.3,存在酉矩阵\(U\)使得\(U^{-1}AU\)为上三角矩阵。由于\(U^{-1},A,U\)都是酉矩阵,根据定理 8.2.20,酉矩阵的乘积仍为酉矩阵,可知\(U^{-1}AU\)仍为酉矩阵。🔗 记 \begin{equation*} B = U^{-1}AU = \begin{pmatrix} b_{11} & b_{12} & \cdots & b_{1n}\\ 0 & b_{22} & \cdots & b_{2n}\\ \vdots & \ddots & \ddots & \vdots\\ 0 & \cdots & 0 & b_{nn} \end{pmatrix}. \end{equation*} 根据定理 8.2.16,\(B\)的第一列\((b_{11},0,\dots,0)^T\)是一个单位向量,所以\(|b_{11}|^2=1\),即\(b_{11}\)是模为\(1\)的复数。再考察\(B\)的第一行,同样根据根据定理 8.2.16,\((b_{11},b_{12},\dots,b_{1n})\)也是一个单位向量,所以 \begin{equation*} |b_{11}|^2+|b_{12}|^2+\cdots+|b_{1n}|^2=1, \end{equation*} 由于\(|b_{11}|^2=1\),所以 \begin{equation*} |b_{12}|^2+\cdots+|b_{1n}|^2=0, \end{equation*} 因此 \begin{equation*} b_{12}=\cdots=b_{1n}=0. \end{equation*} 于是 \begin{equation*} B = \begin{pmatrix} b_{11} & 0 & \cdots & 0\\ 0 & b_{22} & \cdots & b_{2n}\\ \vdots & \ddots & \ddots & \vdots\\ 0 & \cdots & 0 & b_{nn} \end{pmatrix}. \end{equation*} 接下来考虑\(B\)的第2列和第2行, 同理可知\(b_{22}\)是模为\(1\)的复数,且\(b_{23}=\cdots=b_{2n}=0\)。依此类推,可知\(B\)是一个对角矩阵,且主对角元都是模为\(1\)的复数。 🔗 🔗
设酉矩阵\(A\)的所有不同特征值为\(\lambda_1,\dots,\lambda_t\),记\(\lambda_j\)的代数重数(同时也是几何重数)为\(n_j\),则根据定理 8.3.4,存在一个标准正交基,使得\(A\)在此基下的矩阵为 \begin{equation*} \begin{pmatrix} \lambda_1 E_{n_1} & &\\ & \ddots &\\ & & \lambda_t E_{n_t} \end{pmatrix}. \end{equation*} 将这组标准正交基记为 \begin{equation*} (\eta_{11},\dots,\eta_{1n_1},\dots,\eta_{t1},\dots,\eta_{tn_t}), \end{equation*} 其中\(\eta_{j1},\dots,\eta_{jn_j}\)是\(\lambda_j\)特征子空间\(V_{\lambda_j}\)的(标准正交)基。 🔗 由于\((\eta_{11},\dots,\eta_{tn_t})\)是标准正交基,所以对于任意的 \begin{equation*} 1\leq j\ne k\leq t,1\leq s\leq n_j,1\leq r\leq n_k, \end{equation*} 都有 \begin{equation*} \eta_{js}\perp \eta_{kr}. \end{equation*} 因此,\(V_{\lambda_j}\perp V_{\lambda_k}\),结论成立。 🔗 🔗
设\(\lambda_1\ne \lambda_2\)是酉矩阵\(A\)的两个不同特征值。任取\(\lambda_1\)的一个特征向量\(X_1\)和\(\lambda_2\)的一个特征向量\(X_2\),则 \begin{equation*} AX_1 = \lambda_1 X_1,\quad AX_2 = \lambda_2 X_2. \end{equation*} 于是 \begin{align*} X_1^H X_2 = \amp X_1^HE X_2 \\ = \amp X_1^H A^HAX_2\\ = \amp (AX_1)^H (AX_2) \\ = \amp \overline{\lambda_1}\lambda_2 X_1^H X_2. \end{align*} 🔗 根据定理 8.3.4,\(\lambda_1\)和\(\lambda_2\)都是模为1的复数。又因为\(\lambda_1\ne\lambda_2\),所以\(\overline{\lambda_1}\lambda_2\ne 1\),因此\(X_1^H X_2 = 0\),即\(X_1\perp X_2\),进一步可知两个特征子空间正交,结论成立。🔗 🔗
定义 8.3.7. 设 \(A,B\in \R^{n\times n}\)。若存在正交矩阵 \(Q\)使得 \begin{equation*} B = Q^{-1}AQ = Q^TAQ, \end{equation*} 则称\(A\)与\(B\)正交相似。 🔗 🔗
引理 8.3.9. 设\(A\)为正交阵,\(\lambda=a+b{\rm i}(b\ne 0)\)为\(A\)的一个复特征值, \(X=\alpha+{\rm i} \beta\)为对应的一个特征向量,其中\(\alpha,\beta\in \mathbb{R}^n\),则\(\alpha\perp \beta\),且\(\|\alpha\|=\|\beta\|\)。🔗 🔗
因为\(\lambda\)是\(A\)的特征值,\(X\neq 0\)是对应的特征向量,所以\(AX=\lambda X\)成立。将此式两端取共轭,可得 \begin{equation*} \overline{AX} = A\overline{X} = \overline{\lambda} \overline{X} = (a-b{\rm i})(\alpha-{\rm i}\beta), \end{equation*} 即\(\overline{\lambda}\)也是\(A\)特征值,\(\overline{X}\)是\(\overline{\lambda}\)的一个特征向量。 🔗 因为\(b\ne 0\),所以\(\lambda\ne \overline{\lambda}\)。正交矩阵也是酉矩阵,于是根据 推论 8.3.6,\(X\)与\(\overline{X}\)正交,即 \begin{align*} (X,\overline{X})= \amp (\alpha+{\rm i}\beta,\alpha-{\rm i}\beta) \\ = \amp(\alpha,\alpha)-(\beta,\beta)+{\rm i}[(\beta,\alpha)+(\alpha,\beta)] \\ =\amp \|\alpha\|^2-\|\beta\|^2+2{\rm i}(\alpha,\beta)=0. \end{align*} 实部、虚部对应相等可得\(\|\alpha\|^2=\|\beta\|^2\),且\((\alpha,\beta)=0\),即\(\alpha\perp \beta\),\(\|\alpha\|=\|\beta\|\)。 🔗 🔗
定理 8.3.10. 设\(A\)是\(n\)阶正交矩阵,则存在\(n\)阶正交矩阵\(Q\),使得\(Q^{-1}AQ=Q^TAQ\)是分块对角阵 \begin{equation} {\rm diag}\left(\begin{pmatrix} \cos\theta_1& -\sin\theta_1\\ \sin\theta_1& \cos\theta_1 \end{pmatrix},\cdots,\begin{pmatrix} \cos\theta_\ell& -\sin\theta_\ell\\ \sin\theta_\ell& \cos\theta_\ell \end{pmatrix},E_r,-E_s\right),\tag{8.3.2} \end{equation} 其中\(2\ell+r+s=n\)。 🔗 等价地,设\(\phi\)是\(n\)维欧氏空间\(V\)的正交变换,则存在一个标准正交基,使得\(\phi\)在此基下的矩阵型如(8.3.2)。🔗 🔗
先将\(A\)看作酉矩阵,在复数域上考虑问题。根据 推论 8.3.5,\(A\)的特征值都是模为1的复数。由于\(A\)是实矩阵,所以\(A\)的非实特征值在由\(A\)所有特征值构成的多重集中成对出现。记\(A\)的非实特征值共有\(\ell\)对,记为\(\lambda_1,\overline{\lambda_1},\ldots,\lambda_\ell,\overline{\lambda_\ell}\),记\(A\)的\(1\)特征值个数为\(r\),\(-1\)特征值个数为\(s\),则\(A\)的特征值总数为\(2\ell+r+s=n\)。🔗 根据 定理 8.3.4,存在\(n\)阶酉矩阵\(U\),使得\(U^{-1}AU=U^HAU\)为对角矩阵 \begin{equation*} {\rm diag}(\lambda_1,\overline{\lambda_1},\ldots,\lambda_{\ell},\overline{\lambda_\ell},1,\dots,1,-1,\dots,-1). \end{equation*} 🔗 记 \begin{equation*} U=(X_1,Y_1,\dots,X_\ell,Y_\ell,\gamma_1,\ldots,\gamma_r,\gamma_{r+1},\ldots,\gamma_{r+s}), \end{equation*} 结合可对角化矩阵的相关知识,\(U\)矩阵的列向量都是对应特征值的单位特征向量,注意到 \begin{equation*} V_{\overline{\lambda}} = \{\overline{X}| X\in V_{\lambda} \} \triangleq \overline{V_{\lambda}} \end{equation*} 对\(A\)的任意一个非实特征值\(\lambda\)都成立,共轭运算是\(V_{\overline{\lambda}}\)到\(V_{\lambda}\)的可逆映射,且保持向量长度和相互正交的性质,于是可以选择 \begin{equation*} Y_1 = \overline{X_1},\dots, Y_\ell = \overline{X_\ell}. \end{equation*} 实特征值\(\pm 1\)的特征向量都可以在局限在实数域上求解,于是可以选择\(\gamma_1,\dots,\gamma_{r+s}\)都是实列向量。 🔗 记 \begin{equation*} W_j= \langle X_j, \overline{X_j}\rangle, j =1,\dots,\ell; \end{equation*} \begin{equation*} V_1 = \langle \gamma_1,\dots,\gamma_r\rangle,\quad V_{-1} = \langle \gamma_{r+1},\dots,\gamma_{r+s}\rangle. \end{equation*} 由于\(U\)是酉矩阵,所以 \begin{equation*} W_1\oplus\dots\oplus W_\ell\oplus V_1\oplus V_{-1} \end{equation*} 是\(\C^n\)的正交直和分解。 🔗 对每一个\(j=1,\ldots,\ell\),记\(X_j = \alpha_{j}+{\rm i}\beta_{j}\),其中\(\alpha_{j},\beta_{j}\in \R^n\)。 根据 引理 8.3.9,\(\alpha_j\perp \beta_j\),同时注意到 \begin{equation*} \langle \alpha_j,\beta_j\rangle = \langle X_j,\overline{X_j}\rangle = W_j, \end{equation*} 因此,\((e_{\alpha_j},e_{\beta_j})\)是\(W_j\)的一个标准正交基。 🔗 取 \begin{equation*} Q= (e_{\alpha_1},e_{\beta_1},\ldots,e_{\alpha_\ell},e_{\beta_\ell},\gamma_1,\ldots,\gamma_r,\gamma_{r+1},\ldots,\gamma_{r+s}), \end{equation*} 可知\(Q\)的列向量组也是一个标准正交基。又由于\(Q\)是实矩阵,所以\(Q\)是正交矩阵。结合(8.3.1),可知结论成立。 🔗 🔗
定义 8.3.11. 设\(Q\)是一个\(n\)阶正交矩阵。若\(Q\)正交相似于分块对角矩阵 \begin{equation*} {\rm diag}\left(E_{n-2},\begin{pmatrix} \cos\theta & -\sin\theta\\ \sin\theta & \cos\theta \end{pmatrix}\right), \end{equation*} 则称\(Q\)是一个初等旋转矩阵,也称为Givens矩阵/变换。 🔗 🔗
定义 8.3.12. 设\(Q\)是一个\(n\)阶正交矩阵。若\(Q\)正交相似于分块对角矩阵 \begin{equation*} {\rm diag}\left(E_{n-1},-1\right), \end{equation*} 则称\(Q\)是一个反射矩阵,也称为镜面反射,或Householder矩阵/变换。 🔗 🔗
定理 8.3.13. 一个正交矩阵\(Q\)是反射矩阵的充分必要条件为存在一个单位向量\(\eta\),使得 \begin{equation*} Q=E_n -2\eta \eta^T. \end{equation*} 🔗 🔗
根据定义,\(Q\)是反射矩阵的充分必要条件为存在一个标准正交基\((e_1,\ldots,e_n)\),使得 \begin{equation*} Q(e_1,\ldots,e_n)=(e_1,\ldots,e_n){\rm diag}\left(E_{n-1},-1\right). \end{equation*} 记\(\eta=e_n\),则\(\eta\)是一个单位向量。于是 \begin{align*} Q = \amp (e_1,\ldots,e_n){\rm diag}\left(E_{n-1},-1\right)\begin{pmatrix} e_1^T\\ \vdots\\ e_n^T \end{pmatrix} \\ = \amp (e_1,\ldots,e_{n-1},\eta)\left[E_n -\begin{pmatrix} 0 & &&\\ & \ddots & &\\ & & 0 &\\ & & & 2 \end{pmatrix} \right]\begin{pmatrix} e_1^T\\ \vdots\\ e_{n-1}^T\\ \eta^T \end{pmatrix}\\ = \amp E_n - 2\eta \eta^T. \end{align*} 🔗 🔗
5. 设\(\phi\)是欧氏空间\(V\)上的变换,且对任意\(\alpha,\beta\in V\),都有 \begin{equation*} \left(\phi(\alpha),\phi(\beta)\right)=\left(\alpha,\beta\right), \end{equation*} 证明:\(\phi\)是线性变换,因而是正交变换。 🔗 🔗
11. 设\(\alpha_1,\alpha_2,\cdots ,\alpha_m\)和\(\beta_1,\beta_2,\cdots ,\beta_m\)是\(n\)维欧氏空间\(V\)中的两个向量组,证明:存在\(V\)上的一个正交变换\(\phi\),使得 \begin{equation*} \phi(\alpha_i)=\beta_i,\ i=1,2,\cdots ,m \end{equation*} 的充分必要条件是 \begin{equation*} \left(\alpha_i,\alpha_j\right)=\left(\beta_i,\beta_j\right),\ i,j=1,2,\cdots ,m. \end{equation*} 🔗 🔗
12. 记 \begin{equation*} R_{xy}= \left\{ \left.\begin{pmatrix} \cos\theta & -\sin\theta & 0 \\ \sin\theta & \cos\theta & 0 \\ 0 & 0 & 1 \end{pmatrix}\right| \theta\in \R \right\},\quad \mbox{(xoy平面上的旋转)} \end{equation*} \begin{equation*} R_{yz}= \left\{ \left.\begin{pmatrix} 1 & 0 & 0\\ 0 & \cos\theta & -\sin\theta \\ 0 & \sin\theta & \cos\theta \end{pmatrix}\right| \theta\in \R \right\},\quad \mbox{(yoz平面上的旋转)} \end{equation*} 证明:对欧氏空间\(\R^3\)上的第一类正交变换\(A\),存在\(B_1,B_2\in R_{xy}\),\(C\in R_{yz}\),使得 \begin{equation*} A = B_1CB_2. \end{equation*} 🔗 🔗