主要内容

高等代数: 多项式与线性代数

8.1 一般内积空间的定义和举例

章 6 中,通过提取加法和数乘最基本的运算性质,我们将其线性空间的定义从\(\F^n\)推广到一般的集合,从而使得线性空间理论具有广泛适用性。本节将给出内积运算的一般定义,进而拓展内积这一强而有力工具的适用范围。
本节的内容很多是第5章中内容的推广,因此会有部分重复,阅读本部分内容时也可以加深对第5章的内容的理解。

子节 8.1.1 实内积与复内积

由于内积空间中讨论的问题很多都有几何或分析背景,涉及到的运算也不仅限于加、减、乘、除(如长度就涉及到开方运算),因此本书中的内积空间只定义在实/复线性空间中,即本章中的数域\(\F\)仅代表\(\R\)\(\C\)
我们先来看实内积的一般定义。

定义 8.1.1. 实内积与实内积空间.

\(V\)\({\color{blue}\mathbb{R}}\)上线性空间,\((-,\ -): V\times V\rightarrow\mathbb{R}\)\(V\)上的二元函数。 若对任意\(\alpha,\beta,\gamma\in V,\ c\in\mathbb{R}\),都有
  1. 保加法:\(\left( (\alpha+\beta),\gamma\right)=\left(\alpha ,\gamma\right)+\left(\beta ,\gamma\right)\)
  2. 保数乘:\(\left(c\alpha ,\beta\right)=c\left(\alpha ,\beta\right)\)
  3. 对称性:\(\left(\alpha ,\beta\right)=\left(\beta,\alpha\right)\)
  4. 正定性:\(\left(\alpha ,\alpha\right)\geq 0\)且等号成立当且仅当\(\alpha=0\)
则称二元函数\((-,-)\)\(V\)上的一个内积。定义了内积运算的实线性空间\(V\)称为实内积空间。有限维实内积空间称为Euclid(欧几里得)空间,简称欧氏空间
容易验证\(\R^n\)上的标准内积
\begin{equation*} (\alpha,\beta) = \alpha^T\beta=\beta^T\alpha,\forall \alpha,\beta\in \R^n \end{equation*}
满足 定义 8.1.1中的所有4个条件。
实内积前两个性质等价于要求实内积这个二元函数关于它的第一个变量是线性函数,第三个性质对称性则要求其第一个变量和第二个变量的地位完全相同,于是可知实内积关于其第二个变量也是线性函数。
实内积第四条性质正定性保障了用内积定义长度的合理性。
结合这4条性质,实内积函数也被称为对称正定双线性函数
复线性空间上也需要定义内积函数,它是实内积的推广。为了满足正定性,复内积定义中需要对对称性做修正。

定义 8.1.3. 复内积与酉空间.

\(V\)\({\color{red}\mathbb{C}}\)上线性空间,\((-,\ -): V\times V\rightarrow\mathbb{C}\)\(V\)上的二元函数,如果对任意\(\alpha,\beta,\gamma\in V,\ c\in\mathbb{C}\),都有
  1. 第一变量保加法:\(\left( (\alpha+\beta),\gamma\right)=\left(\alpha ,\gamma\right)+\left(\beta ,\gamma\right)\)
  2. 第一变量保数乘:\(\left(c\alpha ,\beta\right)=c\left(\alpha ,\beta\right)\)
  3. 共轭对称性:\(\left(\alpha ,\beta\right)=\overline{\left(\beta,\alpha\right)}\)
  4. 正定性:\(\left(\alpha ,\alpha\right)\geq 0\)且等号成立当且仅当\(\alpha=0\)
则称二元函数\((-,-)\)\(V\)上的一个(复)内积。定义了复内积的复线性空间\(V\)称为 复内积空间。有限维复内积空间也称为酉空间

8.1.4. \(\C^n\)上的标准内积.

定义\(\C^n\)上的二元函数: \((-,-): \C^n\times \C^n \to \C \),对\(\forall \alpha,\beta\in\C^n\)
\begin{equation*} (\alpha,\beta) = \bar{\beta}^T\alpha. \end{equation*}
则可以验证这个二元函数满足复内积的定义。此内积也称为\(\C^n\)上的标准内积
在复内积空间中,共轭运算和转置运算经常一起出现,因此引入一个新的运算符:用 \(A\)表示一个复矩阵,记
\begin{equation*} A^H \triangleq \bar{A}^T =\overline{A^T}. \end{equation*}
于是\(\C^n\)上的标准内积也可表示为
\begin{equation*} (\alpha,\beta) = \bar{\beta}^T\alpha = \beta^H\alpha. \end{equation*}
实内积可以看作是复内积的特例,当\(\left(\alpha ,\beta\right)\in \R\)时,
\begin{equation*} \left(\alpha ,\beta\right) = \overline{\left(\alpha ,\beta\right)} =\left(\beta,\alpha\right). \end{equation*}
进一步地,下述运算性质成立。

证明.

我们也称复内积关于其第二个变量是共轭线性函数

备注 8.1.6.

部分书上复内积关于其第一个变量是共轭线性、关于其第二个变量是线性的。这两种定义没有本质区别,但需要进行区分。

子节 8.1.2 非标准内积举例

子子节 8.1.2.1 矩阵空间上的内积

同阶矩阵全体可以构成一个线性空间\(\F^{m\times n}\),在\(\F^{m\times n}\)上有一个常用内积。
8.1.7. 实矩阵内积.
\(A,B\in \R^{m\times n}\),定义\((-,-) : \R^{m\times n}\times \R^{m\times n} \to \R\)
\begin{equation*} (A,B) = {\rm tr}(A^TB), \end{equation*}
\((-,-)\)\(\R^{m\times n}\)上的一个实内积。
解答.
可以看到,当我们把方阵的列向量组中的列向量按先后顺序接在一起,成为一个\(mn\)维的列向量时,例 8.1.7中定义的矩阵内积本质上就是列向量的标准内积。
8.1.8. 复矩阵内积.
\(A,B\in \C^{m\times n}\),定义\((-,-) : \C^{m\times n}\times \C^{m\times n} \to \C\)
\begin{equation*} (A,B) = {\rm tr}(\bar{B}^T A) = {\rm tr}(B^H A), \end{equation*}
\((-,-)\)\(\C^{m\times n}\)上的一个复内积。
解答.

子子节 8.1.2.2 函数空间的内积

函数空间也是一种常见的线性空间。我们以\(C[a,b]\)(区间\([a,b]\)上的实值连续函数全体构成的线性空间)为例来说明问题。
注意到积分运算本质上也是一种求和运算,同时每一个\(n\)维列向量也可以看成是定义在集合\(\{1,\dots,n\}\)上的一个函数,因此函数空间中的内积通常以积分方式定义。
8.1.9. 函数空间常用内积.
\(f,g\in C[a,b]\),定义
\begin{equation*} \left(f,g\right) = \int_{a}^{b} f(x)g(x){\rm d}x, \end{equation*}
证明\((-,-)\)\(C[a,b]\)上的实内积。
解答.

子子节 8.1.2.3 \(\R^n\)\(\C^n\)上的非标准内积

在标准内积定义中,列向量的不同分量之间彼此地位是等价的。一般内积中,向量的不同分量可以彼此不等价。
8.1.10. 非标准内积举例——加权内积.
解答.

子节 8.1.3 内积空间的性质

注意到\(\R^n\)(或\(\C^n\))中的一些基本几何概念,如长度、夹角、距离等,都是基于标准内积进行定义的。对于一般的线性空间\(V\),当在\(V\)上引入了内积运算后,也可以在\(V\)上定义相关的几何概念,进而利用在\(\R^n\)上形成的几何直观来想象相对抽象的\(V\)空间中可能具有的性质。

定义 8.1.11.

\(V\)是实或复内积空间,\(\alpha\in V\)。定义\(\alpha\)长度(或范数)为\(\sqrt{\left(\alpha,\alpha\right)}\) ,记为\(\|\alpha\|\)
特别地,当\(\|\alpha\|=1\)时,称\(\alpha\)单位向量
称从非0向量\(\alpha\)得到单位向量\(\frac{\alpha}{\|\alpha\|}\)的过程为将\(\alpha\)单位化。记\(e_{\alpha} = \frac{\alpha}{\|\alpha\|}\),称\(e_{\alpha}\)为非0向量\(\alpha\)方向向量。则
\begin{equation} \alpha = \|\alpha\|e_{\alpha}. \tag{8.1.1} \end{equation}
(8.1.1)右端的表示方式称为非0向量\(\alpha\)极分解,在这种表示方式下,向量\(\alpha\)的信息被分解为方向部分(“向”)\(e_{\alpha}\)和长度部分(“量”)\(\|\alpha\|\)
关于内积,Cauchy-Schwarz不等式是一个常用的基本不等式,此不等式有些书上也称为Cauchy-Buniakowski不等式。

证明.

下面的证明针对复内积的情况,实内积的情况是复内积的特例。
\(\alpha,\beta\)线性相关时,则\(\alpha=0\)\(\beta= c \alpha\),其中\(c\in\mathbb{C}\)。若\(\alpha=0\),则
\begin{equation*} \left|\left(\alpha ,\beta\right)\right|=\left|\left(0 ,\beta\right)\right|=0=\|0\|\|\beta\|=\|\alpha\|\|\beta\|\mbox{。} \end{equation*}
\(\beta= c \alpha\),则
\begin{equation*} \left|\left(\alpha ,\beta\right)\right|=\left|\left(\alpha ,c \alpha\right)\right|=\left|\overline{c}\left(\alpha ,\alpha\right)\right|=\left|c\right|\|\alpha\|^2=\|\alpha\|\|\beta\|\mbox{。} \end{equation*}
\(\alpha,\beta\)线性无关时,对任意\(t\in\mathbb{C}\),有\(t\alpha+\beta\neq 0\)。从而
\begin{equation*} 0<\left(t\alpha+ \beta,t\alpha+ \beta\right)=\left(\beta,\beta\right)+t\left(\alpha , \beta\right)+\overline{t}\left(\beta,\alpha\right)+|t|^2\left(\alpha,\alpha\right) \end{equation*}
特别地,取\(t=-\frac{\left(\beta,\alpha\right)}{\left(\alpha,\alpha\right)}\),代入上式得
\begin{equation*} 0<\left(\beta,\beta\right)-\frac{\left(\beta,\alpha\right)}{\left(\alpha,\alpha\right)}\left(\alpha,\beta\right)-\frac{\left(\alpha,\beta\right)}{\left(\alpha,\alpha\right)}\left(\beta , \alpha\right)+\frac{\left(\alpha,\beta\right)\left(\beta,\alpha\right)}{\left(\alpha,\alpha\right)^2}\left(\alpha,\alpha\right)=\|\beta\|^2-\frac{\left|(\alpha,\beta)\right|^2}{\|\alpha\|^2}\mbox{。} \end{equation*}
由此得出,\(\left|\left(\alpha ,\beta\right)\right|< \|\alpha\|\|\beta\|\)
Cauchy-Schwarz不等式对所有的内积空间都成立,用不同的内积定义带入到(8.1.2) 中,可以获得多个常用不等式。例如:
  • 带入标准内积,可得Cauchy不等式:对任意实数\(a_i,b_i(i=1,2,\cdots ,n)\),总有
    \begin{equation*} (a_1b_1+a_2b_2+\cdots +a_nb_n)^2\leq (a_1^2+a_2^2+\cdots +a_n^2)(b_1^2+b_2^2+\cdots +b_n^2); \end{equation*}
  • 带入函数空间内积,可得Schwarz不等式:对任意\(f(x),g(x)\in C[a,b]\),总有
    \begin{equation*} \left(\int_a^b f(x)g(x)dx\right)^2\leq \int_a^b f^2(x)dx\int_a^b g^2(x)dx. \end{equation*}
这些例子一定程度上说明了抽象定义的好处:抽象定义具有普适性和一般性,去除了不必要的细节。在掌握抽象定义后,很多具体实例都更容易被记住,也更容易被应用。
在平面几何中,三角形两边长度之和大于第三边,这个性质被称为三角不等式。三角不等式是关于长度的基本不等式,内积空间中的三角不等式可以利用Cauchy-Schwarz不等式进行证明。结合向量加法的三角形法则,有下面的命题。

证明.

利用Cauchy-Schwarz不等式,我们还可以将夹角的概念推广到一般实内积空间中。

定义 8.1.15.

在实内积空间\(V \)中,非零向量\(\alpha ,\beta\)夹角 \(\theta\)由下式定义:
\begin{equation*} \cos\theta =\frac{\left(\alpha,\beta\right)}{\|\alpha\|\|\beta\|},\ 0\leq \theta\leq \pi. \end{equation*}
Cauchy-Schwarz不等式保证了在实内积空间中
\begin{equation*} -1\le \frac{\left(\alpha,\beta\right)}{\|\alpha\|\|\beta\|}\le 1, \end{equation*}
从而保证了将其定义为夹角余弦值的合理性。
夹角为\(\frac{\pi}{2}\)有特别的意义,此时的夹角余弦值为0。

定义 8.1.16.

在内积空间\(V\) 中,如果两个向量\(\alpha,\beta\)满足
\begin{equation*} \left(\alpha,\beta\right)=0, \end{equation*}
则称\(\alpha\)\(\beta\)正交,记为\(\alpha\bot\beta\)

备注 8.1.17.

按照定义,约定零向量和任何向量都正交。
为了保证余弦值是实数,我们将夹角的定义局限在实内积空间中,而正交的概念不需要局限在实内积空间中。在实内积空间中,非零向量\(\alpha,\beta\)正交等价于\(\alpha,\beta\)的夹角为\(\frac{\pi}{2}\)。借助向量加法的三角形法则,以两个正交的向量\(\alpha,\beta\)为邻边可以构成一个直角三角形,这个直角三角形斜边对应的向量可以取做\(\alpha+\beta\)

练习 8.1.4 练习

基础题.

1.
\(\mathbb{R}^2\)中,对于任意\(\alpha=(a_1,a_2)^T,\beta=(b_1,b_2)^T\),规定
\begin{equation*} \left(\alpha,\beta\right)=a_1b_1-a_1b_2-a_2b_1+2a_2b_2, \end{equation*}
判断\(\mathbb{R}^2\)关于以上定义的\((-,-)\)能否构成欧氏空间。
2.
\(A\)\(n\)阶可逆复矩阵。在\(\mathbb{C}^n\)中,对任意\(X,Y\in\mathbb{C}^n\),规定
\begin{equation*} \left(X,Y\right)=X^TA^T\bar{A}\overline{Y}. \end{equation*}
证明:\(\mathbb{C}^n\)关于以上定义的\((-,-)\)构成酉空间。
3.
\(V\)是实或复内积空间,\(\alpha,\beta\in V\),证明:
  1. 若对任意\(v\in V\)\(\left(\alpha, v\right)=0\),则\(\alpha=0\)
  2. 若对任意\(v\in V\)\(\left(\alpha, v\right)=\left(\beta, v\right)\),则\(\alpha=\beta\)
4.
\(\mathbb{R}^4\)中,求\(\alpha=(2,1,0,2)^T\)\(\beta=(2,1,-3,2)^T\)的夹角。

提高题.

5.
\(V\)是实或复内积空间,\(\alpha,\alpha_1,\alpha_2,\cdots ,\alpha_m\in V\)
  1. \(\alpha\bot\alpha\Leftrightarrow\alpha=0\)
  2. \(\alpha\bot\alpha_i(i=1,2,\cdots ,m)\),则对任意\(\xi\in\langle \alpha_1,\alpha_2,\cdots ,\alpha_m\rangle\),总有\(\alpha\bot\xi\)
6.
\(\xi_1,\xi_2,\cdots ,\xi_n\)是内积空间\(V\)的一个基,\(\alpha=\sum\limits_{i=1}^n x_i\xi_i,\beta=\sum\limits_{i=1}^n y_i\xi_i\in V\)。令
\begin{equation*} G=\begin{pmatrix} \left(\xi_1,\xi_1\right)&\left(\xi_1,\xi_2\right)&\cdots&\left(\xi_1,\xi_n\right)\\ \left(\xi_2,\xi_1\right)&\left(\xi_2,\xi_2\right)&\cdots&\left(\xi_2,\xi_n\right)\\ \cdots&\cdots&\cdots&\cdots\\ \left(\xi_n,\xi_1\right)&\left(\xi_n,\xi_2\right)&\cdots&\left(\xi_n,\xi_n\right) \end{pmatrix}, \end{equation*}
证明:
  1. \(\left(\alpha,\beta\right)=X^TG\overline{Y}\),其中\(X=(x_1,x_2,\cdots,x_n)^T,Y=(y_1,y_2,\cdots ,y_n)^T\)
  2. \(G\)是可逆矩阵。
7.
对于实内积空间\(C[-1,1]\),内积定义为
\begin{equation*} \left(f(x),g(x)\right)=\int_{-1}^1 f(x)g(x)dx, \end{equation*}
\(\| 1\|\)
8.
\(V\)是实内积空间,证明:
\begin{equation*} \left(\alpha,\beta\right)=\frac{1}{4}\left(\|\alpha+\beta\|^2-\|\alpha- \beta\|^2\right),\ \forall \alpha,\beta\in V. \end{equation*}
(这个恒等式称为极化恒等式。)
9.
\(V\)是实内积空间,\(\alpha,\beta\in V\),证明:
\begin{equation*} \|\alpha+\beta\|^2+\|\alpha- \beta\|^2=2\|\alpha\|^2+2\|\beta\|^2. \end{equation*}
\(V\)是几何空间时,说明这个恒等式的几何意义。
10.
在实或复内积空间\(V\)中,定义\(d(\alpha,\beta)=\|\alpha- \beta\|\)为两个向量\(\alpha,\beta\)间的距离,证明:
  1. \(d(\alpha,\beta)\geq 0\)
  2. \(d(\alpha,\beta)=0\)当且仅当\(\alpha=\beta\)
  3. \(d(\alpha,\beta)=d(\beta,\alpha)\)
  4. \(d(\alpha,\beta)\leq d(\alpha,\gamma)+d(\gamma,\beta)\)

挑战题.

11.