定义 8.3.1. 设 \(A,B\in \C^{n\times n}\)。若存在酉矩阵 \(U\)使得 \begin{equation*} B = U^{-1}AU = U^HAU, \end{equation*} 则称\(A\)与\(B\)酉相似。 🔗 🔗
取\(A ={\rm diag}(\lambda_1,\dots,\lambda_t) \),其中\(\lambda_1,\dots,\lambda_t\)互不相同;取\(B = P^{-1}AP \)。当\(P\)的列向量组不是正交向量组时\(A\)与\(B\)相似但不是正交相似。这是因为\(A\)的特征子空间分解将空间分为\(t\)个两两正交的特征子空间的直和,而\(A\)的特征子空间分解中存在不相互正交的特征子空间。🔗 🔗
对复方阵\(A\)的阶数\(n\)作归纳法。🔗 当\(n=1\)时,结论显然成立。🔗 假设对\(n-1\)阶复方阵结论成立,以下考虑\(n\)阶复方阵\(A\)。由于\(A\)是复方阵,根据代数学基本定理,\(A\)存在特征值\(\lambda_1\in\mathbb{C}\)。设\(X_1\in\mathbb{C}^n\)是\(A\)属于\(\lambda_1\)的单位特征向量,可将其扩充为\(\C^n\)的一个标准正交基\((X_1,\ldots,X_n)\)。将该标准正交基中的向量按列拼成一个矩阵,记 \begin{equation*} U_1=(X_1,\ldots,X_n), \end{equation*} 根据定理 8.2.15,\(U_1\)是酉矩阵。根据定义可知 \begin{equation*} A(X_1,\ldots,X_n)=(X_1,\ldots,X_n)\begin{pmatrix} \lambda_1 & *\\ 0 & A_1 \end{pmatrix}, \end{equation*} 其中\(A_1\)是\(n-1\)阶复方阵,即 \begin{equation*} U_1^{-1}AU_1=\begin{pmatrix} \lambda_1 & *\\ 0 & A_1 \end{pmatrix}. \end{equation*} 由归纳假设,存在\(n-1\)阶酉矩阵\(U_2\),使得\(U_2^{-1}A_1U_2\)为上三角矩阵,不妨记 \begin{equation*} U_2^{-1}A_1U_2=\begin{pmatrix} \lambda_2 & & *\\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix}. \end{equation*} 取\(U=U_1\begin{pmatrix} 1 & 0\\ 0 & U_2 \end{pmatrix}\),则\(U\)是\(n\)阶酉矩阵,且 \begin{equation*} U^{-1}AU=\begin{pmatrix} \lambda_1 & *\\ 0 & U_2^{-1}A_1U_2 \end{pmatrix}=\begin{pmatrix} \lambda_1 & & *\\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix} \end{equation*} 是上三角矩阵,结论成立。 🔗 证法二:由于\(A\)为复方阵,所以由定理 7.3.20,存在\(n\)阶可逆复矩阵\(P\),使得 \begin{equation*} P^{-1}AP = \begin{pmatrix} \lambda_1 & & * \\ & \ddots & \\ 0 & & \lambda_n \end{pmatrix} \end{equation*} 为上三角矩阵。将可逆矩阵\(P\)作QR分解,存在酉矩阵\(U\)及对角元均大于0的上三角矩阵\(R\),使得\(P=UR\)。则 \begin{equation*} U^{-1}AU=R(P^{-1}AP)R^{-1}. \end{equation*} 由于\(P^{-1}AP,R,R^{-1}\)都是上三角矩阵,所以乘积矩阵\(R(P^{-1}AP)R^{-1}\)仍为上三角矩阵,即\(U^{-1}AU\)是上三角矩阵,结论成立。 🔗 🔗
定理 8.3.4. 设\(A\)是\(n\)阶酉矩阵,则存在\(n\)阶酉矩阵\(U\),使得 \begin{equation*} U^{-1}AU=U^HAU \end{equation*} 为对角矩阵,且主对角元都是模为\(1\)的复数。 🔗 等价地,设\(\phi\)是\(n\)维酉空间的酉变换,则存在一个标准正交基,使得\(\phi\)在此基下的矩阵是对角矩阵,且主对角元都是模为\(1\)的复数。🔗 🔗
根据定理 8.3.3,存在酉矩阵\(U\)使得\(U^{-1}AU\)为上三角矩阵。由\(U^{-1},A,U\)都是酉矩阵可知,\(U^{-1}AU\)仍为酉矩阵。注意到上三角酉矩阵必是对角矩阵,且主对角元是模为\(1\)的复数,所以结论成立。🔗 🔗
定义 8.3.7. 设 \(A,B\in \R^{n\times n}\)。若存在正交矩阵 \(Q\)使得 \begin{equation*} B = Q^{-1}AQ = Q^TAQ, \end{equation*} 则称\(A\)与\(B\)正交相似。 🔗 🔗
引理 8.3.9. 设\(A\)为正交阵,\(\lambda=a+bi(b\ne 0)\)为\(A\)的一个复特征值, \(X=\alpha+i \beta\)为对应的一个特征向量,其中\(\alpha,\beta\in \mathbb{R}^n\),则\(\alpha\perp \beta\),且\(|\alpha|=|\beta|\)。🔗 🔗
因为\(\lambda\)是\(A\)的特征值,\(X\neq 0\)是对应的特征向量,所以\(AX=\lambda X\)成立。将此式两端取共轭,可得 \begin{equation*} \overline{AX} = A\overline{X} = \overline{\lambda} \overline{X} = (a-bi)(\alpha-i\beta), \end{equation*} 即\(\overline{\lambda}\)也是\(A\)特征值,\(\overline{X}\)是\(\overline{\lambda}\)的一个特征向量。 🔗 因为\(b\ne 0\),所以\(\lambda\ne \overline{\lambda}\)。正交矩阵也是酉矩阵,于是根据 推论 8.3.6,\(X\)与\(\overline{X}\)正交,即 \begin{align*} (X,\overline{X})= \amp (\alpha+i\beta,\alpha-i\beta) \\ = \amp(\alpha,\alpha)-(\beta,\beta)+i[(\beta,\alpha)+(\alpha,\beta)] \\ =\amp \|\alpha\|^2-\|\beta\|^2+2i(\alpha,\beta)=0. \end{align*} 实部、虚部对应相等可得\(\|\alpha\|^2=\|\beta\|^2\),且\((\alpha,\beta)=0\),即\(\alpha\perp \beta\),\(|\alpha|=|\beta|\)。 🔗 🔗
定理 8.3.10. 设\(A\)是\(n\)阶正交矩阵,则存在\(n\)阶正交矩阵\(Q\),使\(Q^{-1}AQ=Q^TAQ\)是分块对角阵 \begin{equation} {\rm diag}\left(\begin{pmatrix} \cos\theta_1& -\sin\theta_1\\ \sin\theta_1& \cos\theta_1 \end{pmatrix},\cdots,\begin{pmatrix} \cos\theta_\ell& -\sin\theta_\ell\\ \sin\theta_\ell& \cos\theta_\ell \end{pmatrix},E_r,-E_s\right),\tag{8.3.2} \end{equation} 其中\(2\ell+r+s=n\)。 🔗 等价地,设\(\phi\)是\(n\)维欧氏空间\(V\)的正交变换,则存在一个标准正交基,使得\(\phi\)在此基下的矩阵型如(8.3.2)。🔗 🔗
现将\(A\)看作酉矩阵,在复数域上考虑问题。根据 推论 8.3.5,\(A\)的特征值都是模为1的复数。且由于\(A\)是实矩阵,所以\(A\)的非实特征值成对出现。记\(A\)的非实特征值共有\(\ell\)对,记为\(\lambda_1,\overline{\lambda_1},\ldots,\lambda_\ell,\overline{\lambda_\ell}\),记\(A\)的\(1\)特征值个数为\(r\),\(-1\)特征值个数为\(s\),则\(A\)的特征值总数为\(2\ell+r+s=n\)。🔗 根据 定理 8.3.4,存在\(n\)阶酉矩阵\(U\),使得\(U^{-1}AU=U^HAU\)为对角矩阵 \begin{equation*} {\rm diag}(\lambda_1,\overline{\lambda_1},\ldots,\lambda_{\ell},\overline{\lambda_\ell},1,\dots,1,-1,\dots,-1). \end{equation*} 🔗 记 \begin{equation*} U=(X_1,Y_1,\dots,X_\ell,Y_\ell,\gamma_1,\ldots,\gamma_r,\gamma_{r+1},\ldots,\gamma_{r+s}), \end{equation*} 结合可对角化矩阵的相关知识,\(U\)矩阵的列向量都是对应特征值的单位特征向量,可以选择 \begin{equation*} Y_1 = \overline{X_1},\dots, Y_\ell = \overline{X_\ell}, \end{equation*} 且\(\gamma_1,\dots,\gamma_{r+s}\)都是实列向量。 🔗 对每一个\(j=1,\ldots,\ell\),记\(X_j = \alpha_{j}+i\beta_{j}\),其中\(\alpha_{j},\beta_{j}\in \R^n\)。 取 \begin{equation*} Q= (e_{\alpha_1},e_{\beta_1},\ldots,e_{\alpha_\ell},e_{\beta_\ell},\gamma_1,\ldots,\gamma_r,\gamma_{r+1},\ldots,\gamma_{r+s}), \end{equation*} 结合 引理 8.3.9,可以验证\(Q\)是正交矩阵。再结合 (8.3.1),可知结论成立。 🔗 🔗
定义 8.3.11. 设\(Q\)是一个\(n\)阶正交矩阵。若\(Q\)正交相似于分块对角矩阵 \begin{equation*} {\rm diag}\left(E_{n-2},\begin{pmatrix} \cos\theta & -\sin\theta\\ \sin\theta & \cos\theta \end{pmatrix}\right), \end{equation*} 则称\(Q\)是一个初等旋转矩阵,也称为Givens矩阵/变换。 🔗 🔗
定义 8.3.12. 设\(Q\)是一个\(n\)阶正交矩阵。若\(Q\)正交相似于分块对角矩阵 \begin{equation*} {\rm diag}\left(E_{n-1},-1\right), \end{equation*} 则称\(Q\)是一个反射矩阵,也称为镜面反射,或Householder矩阵/变换。 🔗 🔗
定理 8.3.13. 一个正交矩阵\(Q\)是反射矩阵的充分必要条件为存在一个单位向量\(\eta\),使得 \begin{equation*} Q=E_n -2\eta \eta^T. \end{equation*} 🔗 🔗
2. 设\(\varphi\)是欧氏空间\(V\)上的变换,且对任意\(\alpha,\beta\in V\),都有 \begin{equation*} \left(\varphi(\alpha),\varphi(\beta)\right)=\left(\alpha,\beta\right), \end{equation*} 证明:\(\varphi\)是线性变换,因而是正交变换。 🔗 🔗
7. 设\(\alpha_1,\alpha_2,\cdots ,\alpha_m\)和\(\beta_1,\beta_2,\cdots ,\beta_m\)是\(n\)维欧氏空间\(V\)中的两个向量组,证明:存在\(V\)上的一个正交变换\(\varphi\),使得 \begin{equation*} \varphi(\alpha_i)=\beta_i,\ i=1,2,\cdots ,m \end{equation*} 的充分必要条件是 \begin{equation*} \left(\alpha_i,\alpha_j\right)=\left(\beta_i,\beta_j\right),\ i,j=1,2,\cdots ,m. \end{equation*} 🔗 🔗
8. 记 \begin{equation*} R_{xy}= \left\{ \left.\begin{pmatrix} \cos\theta & -\sin\theta & 0 \\ \sin\theta & \cos\theta & 0 \\ 0 & 0 & 1 \end{pmatrix}\right| \theta\in \R \right\},\quad \mbox{(xoy平面上的旋转)} \end{equation*} \begin{equation*} R_{yz}= \left\{ \left.\begin{pmatrix} 1 & 0 & 0\\ 0 & \cos\theta & -\sin\theta \\ 0 & \sin\theta & \cos\theta \end{pmatrix}\right| \theta\in \R \right\},\quad \mbox{(yoz平面上的旋转)} \end{equation*} 证明:对欧氏空间\(\R^3\)上的第一类正交变换\(A\),存在\(B_1,B_2\in R_{xy}\),\(C\in R_{yz}\),使得 \begin{equation*} A = B_1CB_2. \end{equation*} 🔗 🔗