主要内容

高等代数: 多项式与线性代数

8.3 酉矩阵、正交矩阵与标准型

如上一节所述,当我们在一个内积空间中考虑问题时,基的选择通常局限在标准正交基中。此时,基变换过程中的过渡矩阵不单单只要求可逆,还需要进一步限制在酉矩阵或正交矩阵中。于是,相似变换中的可逆矩阵也需要同步限制为酉矩阵或正交矩阵,这就导出了酉相似与正交相似的概念。本节中我们将介绍酉相似与正交相似标准型的相关结论。特别地,我们将介绍酉矩阵和正交矩阵这两类特殊矩阵的酉相似/正交相似标准型。
复内积空间中的酉矩阵与酉相似标准型结论更为一般、简单,但很多实际问题是局限在实数域上的,因此在接下来的介绍过程中,我们先给出复内积空间中的结论,然后再结合复内积空间的结论讨论实内积空间上的相关问题。

子节 8.3.1 酉相似与标准型

我们先给出酉相似的具体概念。

定义 8.3.1.

A,BCn×n。若存在酉矩阵 U使得
B=U1AU=UHAU,
则称AB酉相似
结合酉矩阵的逆是酉矩阵,以及同阶酉矩阵相乘仍然是酉矩阵,容易验证酉相似关系也是一种等价关系。
酉相似是特殊的相似,若AB酉相似,则AB必定相似;反之则未必。

8.3.2. 相似但不酉相似.

A=diag(λ1,,λt),其中λ1,,λt互不相同;取B=P1AP。当P的列向量组不是正交向量组时AB相似但不是正交相似。这是因为A的特征子空间分解将空间分为t个两两正交的特征子空间的直和,而A的特征子空间分解中存在不相互正交的特征子空间。
下面我们把对相似关系成立的一个重要结论推广到酉相似关系。定理 7.3.20说明复方阵都可相似于上三角矩阵,这个结论可以加强到酉相似,相应的结论称为Schur上三角化定理。

证明.

接下来我们应用定理 8.3.3来研究酉矩阵的酉相似标准型。

子节 8.3.2 正交相似与标准型

很多实际问题都局限在实数域上,实数域本身也是最常用的数域,因此,有必要将我们的讨论限制在实数域上。

定义 8.3.5.

A,BRn×n。若存在正交矩阵 Q使得
B=Q1AQ=QTAQ,
则称AB正交相似
类似于复方阵的Schur上三角化定理,一些实方阵也可正交上三角化,不过此时需要矩阵的特征值都是实数。

证明.

下面考虑正交矩阵的标准型。先来考虑R2空间上的正交变换,即2阶正交矩阵。由于正交矩阵的列向量组和行向量组都是标准正交基,所以正交矩阵只可能是下面两种形式之一:
Q1=(cosθsinθsinθcosθ),Q2=(cosθsinθsinθcosθ).
简单计算可知:Q1的特征值是cosθ±isinθQ2的特征值是±1
正交矩阵是特殊的酉矩阵,所有正交矩阵的特征值也都是模为1的复数。当一个正交矩阵A存在不是实数的特征值时,A不可能正交相似于实对角矩阵。注意到实矩阵不是实数的特征值都是成对出现的,所以有下面的引理。

证明.

沿用 引理 8.3.7中的记号。因|λ|=1a2+b2=1,故可设a=cosθ,b=sinθ。令特征方程中AX=λX中实部和虚部对应相等可得:
Aα=aαbβ=(α,β)(cosθsinθ),
Aβ=bα+aβ=(α,β)(sinθcosθ).
A(α,β)=(α,β)(cosθsinθsinθcosθ).
于是有下面的结论。

子节 8.3.3 “初等”正交矩阵

可逆矩阵可以分解为3类初等矩阵的乘积,正交矩阵也可以做类似的分解。
沿用定理 8.3.8中的记号,一个正交矩阵A中每一对互为共轭的特征值都可以对应于标准型中一个对角块
(cosθjsinθjsinθjcosθj)Rθj.
从变换的角度,这一对互为共轭的特征值也对应一个2维的不变子空间,记此不变子空间为Vj。将正交变换A局限作用在Vj上,则其作用效果等同于用Rθj作用在R2上, 即将Vj空间绕坐标原点沿逆时针方向旋转角θj。我们引入如下术语。

定义 8.3.9.

Q是一个n阶正交矩阵。若Q正交相似于分块对角矩阵
diag(En2,(cosθsinθsinθcosθ)),
则称Q是一个初等旋转矩阵,也称为Givens矩阵/变换
在初等旋转矩阵的定义中,我们允许θ=kπ, kZ:当θ=2kπ时初等旋转矩阵就是单位矩阵,所作变换相当于旋转0度角;当θ=(2k+1)π时,初等旋转矩阵的特征值为n2121,所做变换限制在1的特征子空间上是一个180的旋转。
标准型中的一个1特征值可以与下面的正交变换相对应。

定义 8.3.10.

Q是一个n阶正交矩阵。若Q正交相似于分块对角矩阵
diag(En2,1),
则称Q是一个反射矩阵,也称为镜面反射,或Householder矩阵/变换
我们有下面的结论。

证明.

镜面反射也有明显的几何特征。设Q=En2ηηT,其中η是一个单位向量。记 W=η,即W是与η垂直的n1维子空间。对于αRn
αQα=2ηηTα=2(α,η)ηW,
α+Qα2=α(α,η)η=ProjW(α)W,
也就是说αQα关于n1维子空间W对称。若我们将W想象为一个高维镜面,则Qα恰好是α在镜面W中的像,这也是此种变换称为镜面反射的原因。
镜面反射是比初等旋转矩阵还要基本的一种矩阵,容易看到每一个初等旋转矩阵都可以分解为两个反射矩阵的乘积(见作业题)。根据标准型定理,每一个正交矩阵都可以写成一些初等旋转矩阵与一个反射矩阵的乘积,进而每一个正交矩阵都可以分解为若干个反射矩阵的乘积。
本节的最后,我们给出正交矩阵的一个分类。

定义 8.3.12.

Q是一个正交矩阵。
  • detQ=1,则称Q第一类正交矩阵
  • detQ=1,则称Q第二类正交矩阵
我们把初等旋转矩阵和反射矩阵称为初等正交矩阵。在把一般正交矩阵分解为初等正交矩阵乘积的过程中,第一类正交矩阵的分解只需要用到初等旋转矩阵,第二类正交矩阵的分解至少用到一个反射矩阵。
初等旋转矩阵和反射矩阵作为变换都有典型的几何意义。理解和熟练使用这两种变换对于解决很多实际问题都有很大帮助。特别地,反射矩阵在广义QR分解和矩阵特征值估计的数值算法中都有重要应用,有兴趣的同学可以查阅数值代数的相关专业书籍,如 Gene H. Golub and Charles F. Van Loan, Matrix Computations (4th edition), Baltimore: The Johns Hopkins University Press, 2013.

练习 8.3.4 练习

基础题.

提高题.

2.
φ是欧氏空间V上的变换,且对任意α,βV,都有
(φ(α),φ(β))=(α,β),
证明:φ是线性变换,因而是正交变换。
3.
φ是正交变换,Uφ-子空间,证明:U也是φ-子空间。
4.
φ是酉变换,证明:φ的属于不同特征值的特征向量必正交。
5.
ξ,ηn维欧氏空间V中两个不同的单位向量,证明:存在一个镜面反射φ,使得φ(ξ)=η

挑战题.

6.
证明:n维欧氏空间V中任意正交变换φ都可以表为一系列镜面反射的乘积。
7.
α1,α2,,αmβ1,β2,,βmn维欧氏空间V中的两个向量组,证明:存在V上的一个正交变换φ,使得
φ(αi)=βi, i=1,2,,m
的充分必要条件是
(αi,αj)=(βi,βj), i,j=1,2,,m.
8.
Rxy={(cosθsinθ0sinθcosθ0001)|θR},(xoy平面上的旋转)
Ryz={(1000cosθsinθ0sinθcosθ)|θR},(yoz平面上的旋转)
证明:对欧氏空间R3上的第一类正交变换A,存在B1,B2RxyCRyz,使得
A=B1CB2.