主要内容\(\newcommand{\Ima}{\rm Im }
\newcommand{\N}{\mathbb N}
\newcommand{\Z}{\mathbb Z}
\newcommand{\Q}{\mathbb Q}
\newcommand{\R}{\mathbb R}
\newcommand{\F}{\mathbb F}
\newcommand{\C}{\mathbb C}
\newcommand{\K}{\mathbb K}
\newcommand{\myunit}{1 cm}
\newcommand{\blue}[1]{{\color{blue}#1}}
\newcommand\iddots{\mathinner{
\kern1mu\raise1pt{.}
\kern2mu\raise4pt{.}
\kern2mu\raise7pt{\Rule{0pt}{7pt}{0pt}.}
\kern1mu
}}
\tikzset{
node style sp/.style={draw,circle,minimum size=\myunit},
node style ge/.style={circle,minimum size=\myunit},
arrow style mul/.style={draw,sloped,midway,fill=white},
arrow style plus/.style={midway,sloped,fill=white},
}
\newcommand{\lt}{<}
\newcommand{\gt}{>}
\newcommand{\amp}{&}
\definecolor{fillinmathshade}{gray}{0.9}
\newcommand{\fillinmath}[1]{\mathchoice{\colorbox{fillinmathshade}{$\displaystyle \phantom{\,#1\,}$}}{\colorbox{fillinmathshade}{$\textstyle \phantom{\,#1\,}$}}{\colorbox{fillinmathshade}{$\scriptstyle \phantom{\,#1\,}$}}{\colorbox{fillinmathshade}{$\scriptscriptstyle\phantom{\,#1\,}$}}}
\)
节 5.1 标准内积及其几何意义
我们对于列向量空间的直观理解来源于其几何直观:
\(\R(=\R^1)\)通常被想象为直线,
\(\R^2\)被想象为坐标平面,
\(\R^3\)则被想象为带了坐标系的立体空间。利用列向量空间中的加法和数乘运算,我们熟悉的一些几何概念,如共线、共面等,已经较为完美地实现了代数化。但还有另外一些常用的几何概念,如长度、夹角等,只用这两种运算还不能进行有效描述。本章中,在加法和数乘这两种运算的基础上,我们将再引入一种新的运算——内积运算。利用内积运算,可以实现长度、夹角等几何概念的代数化。
子节 5.1.1 标准内积的概念
定义 5.1.1.
设 \(\alpha=(a_1,\dots,a_n)^T\in \R^n\)、\(\beta=(b_1,\dots,b_n)^T\in \R^n\)。\(\alpha\)与\(\beta\)的(标准)内积(也称点积、数量积),记做\(\alpha\cdot \beta\),定义为
\begin{equation}
\alpha\cdot \beta \triangleq a_1b_1+\cdots+a_nb_n.\tag{5.1.1}
\end{equation}
标准内积运算是定义在两个相同维数的向量间的,维数不同的向量不能进行标准内积运算。
记号上,标准内积运算和数乘运算定义中都使用了
\(\cdot\)做为运算符。在实际使用过程中,容易根据上下文进行区分
\(\cdot\)具体表示的是哪种运算。除非为了强调,数乘运算通常情况下省略运算符,而内积运算的正确写法不可以省略运算符。
注意到定义式
(5.1.1)的右端是两项相乘相加的形式,与矩阵乘法中元素的公式是类似的,所以内积也可以用矩阵乘法来进行表示:
\begin{equation*}
\alpha\cdot \beta = \alpha^T\beta=\beta^T\alpha.
\end{equation*}
矩阵的乘法也可以按照内积进行新的理解:设\(A\)和\(B\)是两个可乘的矩阵,对\(A\)做行分块,对\(B\)做列分块,记为
\begin{equation*}
A = \begin{pmatrix}
\alpha_1^T\\ \vdots\\ \alpha_m^T
\end{pmatrix},\quad B = (\beta_1,\dots,\beta_k),
\end{equation*}
则
\begin{equation*}
AB = \begin{pmatrix}
\alpha_1^T\beta_1 & \cdots & \alpha_1^T\beta_k\\
\vdots & \ddots & \vdots \\
\alpha_m^T\beta_1 & \cdots & \alpha_m^T\beta_k
\end{pmatrix} = (\alpha_i\cdot \beta_j)_{m\times k},
\end{equation*}
其中\(A\)和\(B\)的可乘性,即\(A\)的列数和\(B\)的行数相等,保证了\(\alpha_i\)和\(\beta_j\)都是同长的列向量,也就保证了内积运算的可行性。
根据定义,容易验证内积运算满足如下一些常用的运算规则。
定理 5.1.3.
设\(\alpha\)、\(\beta\)和\(\gamma\)是任给的\(\R^n\)中的列向量,\(c\)是一个实数。则内积运算满足下述运算性质:
-
交换性:
\(\alpha\cdot \beta =\beta\cdot \alpha\),
-
保加法:
\((\alpha+\gamma)\cdot \beta = \alpha \cdot \beta +\gamma \cdot \beta\),
-
保数乘:
\((c\alpha)\cdot \beta=c(\alpha\cdot \beta)\),
-
正定性:
\(\alpha\cdot\alpha\ge 0\),且
\(\alpha\cdot\alpha= 0\)当且仅当
\(\alpha =0\)。
交换性保证了内积运算中第一个列向量和第二个列向量的地位是等同的,于是保加法和数乘的性质也可写成:
-
保加法’:
\(\alpha\cdot (\beta+\gamma) = \alpha \cdot \beta +\alpha\cdot\gamma\),
-
保数乘’:
\(\alpha\cdot (c\beta)=c(\alpha\cdot \beta)\)。
例 5.1.4.
设
\(\alpha=(1,2,3)^T\)、
\(\beta=(4,5,6)^T\),计算内积
\(\alpha\cdot \beta\)。
解答.
\(\alpha\cdot \beta = \alpha^T\beta=1\times 4+2\times 5+3\times 6=32.\)
注意到内积运算实质上可以理解为由两个同维列向量对应一个实数,因此也可以将其抽象的理解为
\(\R^n\times \R^n\to \R\)的一个映射。对于
\(\R^n\)的一个线性子空间
\(V\),不同于加法和数乘运算,内积运算没有封闭性的问题。因此内积运算也可以局限定义在
\(V\)上。
定义 5.1.5.
设
\(V\)是
\(\R^n\)的一个线性子空间。集合
\(V\),线性空间的加法运算、数乘运算,以及内积运算,这四者构成的整体称为一个
标准内积空间。
习惯上,类似于列向量空间的线性子空间,我们仍使用集合
\(V\)的记号作为标准内积空间的表示记号。特别地,
\(\R^n\)是我们最常用的内积空间。
标准内积空间是在列向量空间线性子空间基础上定义的,是特殊的线性子空间,关于线性子空间的所有定义,如维数、子空间、直和等,对于标准内积空间依然适用,这里不再一一列举。
子节 5.1.2 内积运算与长度
向量
\(\alpha\)的“长度”也常被称作为“范数”,记做
\(\|\alpha\|\),这个概念是从我们熟悉的
\(\R^2\)和
\(\R^3\)中推广到一般
\(\R^n\)所获得的。
当\(\alpha=(x,y)^T\in \R^2\)时,向量\(\alpha\)的“长度”可以被自然定义为坐标平面中坐标原点到点\((x,y)^T\)的距离,也就是\(\alpha\)作为有向线段时线段的长度,根据勾股定理,有公式
\begin{equation*}
\| \alpha\| = \sqrt{x^2+y^2}.
\end{equation*}
这个公式也可以作为\(\R^2\)中长度的定义式。类似地,当\(\alpha=(x,y,z)^T\in \R^3\)时,其长度的定义公式为
\begin{equation*}
\| \alpha\| = \sqrt{x^2+y^2+z^2}.
\end{equation*}
定义 5.1.6.
设\(\alpha=(a_1,\dots,a_n)^T\in \R^n\)。向量\(\alpha\)的长度(也称为范数),记做\(\|\alpha\|\),定义为
\begin{equation*}
\|\alpha\| \triangleq \sqrt{a_1^2+\cdots+a_n^2}.
\end{equation*}
由内积的定义,长度也可以由内积运算来定义:
\begin{equation*}
\|\alpha\| = \sqrt{a_1^2+\cdots+a_n^2}=\sqrt{\alpha\cdot \alpha}.
\end{equation*}
内积运算的正定性保证了开方运算的合理性,同时保证了只有0向量的长度是0。
命题 5.1.7.
设\(\alpha\in \R^n\)是一个任意给定的列向量,\(c\)是一个任意实数,则
\begin{equation*}
\|c\alpha\| = |c| \|\alpha\|.
\end{equation*}
当一个列向量
\(\alpha\)的长度为1,即
\(\|\alpha\|=1\)时,称
\(\alpha\)为
单位向量。坐标平面
\(\R^2\)中的所有单位向量(按点理解)构成了以原点为圆心半径为1的单位圆周,
\(\R^3\)中的单位向量构成的则是单位球面。
对任意非零向量
\(\alpha\),
\(\frac{\alpha}{\|\alpha\|}\)是单位向量。 称从非0向量
\(\alpha\)得到单位向量
\(\frac{\alpha}{\|\alpha\|}\)的过程为将
\(\alpha\)单位化。记
\(e_{\alpha} = \frac{\alpha}{\|\alpha\|}\),称
\(e_{\alpha}\)为非0向量
\(\alpha\)的
方向向量。
例 5.1.8.
将向量
\(\alpha=(2,-1,2)^T\)单位化。
解答.
\(\|\alpha\|=\sqrt{2^2+(-1)^2+2^2}=3\),所以
\(e_{\alpha} =\frac{1}{3}\alpha = (\frac{2}{3},-\frac{1}{3},\frac{2}{3})^T \)。
在接下来的讨论中,我们需要使用一个中学时学过的不等式,Cauchy不等式:
\begin{equation*}
(a_1b_1+\cdots +a_nb_n)^2\le (a_1^2+\cdots +a_n^2)(b_1^2+\cdots+b_n^2).
\end{equation*}
利用内积的语言,这个不等式的形式和证明都可以被大大简化。
定理 5.1.9. Cauchy不等式.
对任意的\(\alpha ,\beta\in \R^n\),总有
\begin{equation}
\left|\alpha\cdot\beta\right|\leq \|\alpha\| \|\beta\|.\tag{5.1.2}
\end{equation}
(5.1.2)中等号成立的充分必要条件是
\(\alpha\)与
\(\beta\)线性相关。
证明.
容易验证当
\(\alpha=0\)或
\(\beta=0\)时结论成立。下面我们讨论一般情形,即假设
\(\alpha\ne 0\)且
\(\beta\ne 0\)。
引入辅助函数
\begin{align*}
f(t)\amp\triangleq (\alpha+t\beta)\cdot(\alpha+t\beta) \\
\amp = \alpha\cdot \alpha +2(\alpha\cdot \beta)t +(\beta\cdot \beta) t^2 \\
\amp = \|\alpha\|^2+2(\alpha\cdot \beta)t+ \|\beta\|^2 t^2,
\end{align*}
其中\(t\in \R\)是一个实变量。则\(f(t)\)是关于\(t\)的一个实值二次函数。
根据内积运算的正定性,\(f(t)\ge 0\)对任意的\(t\)均成立。又根据二次函数的知识可知恒大于等于0的二次函数其判别式应该大于等于0,可得
\begin{equation*}
[2(\alpha\cdot \beta)]^2-4\|\beta\|^2 \|\alpha\|^2\le 0,
\end{equation*}
下面证明等号成立的充分必要条件。
(5.1.2)中等号成立当且仅当二次函数
\(f(t)\)的判别式等于0,也就等价于存在
\(t\)使得
\(f(t)=0\)。仍根据内积运算的正定性,可知此时
\begin{equation*}
\alpha+t\beta=0,
\end{equation*}
即\(\alpha\)与 \(\beta\)线性相关。
借助Cauchy不等式,我们可以给出一个关于长度的基本不等式,称为
三角不等式。如下图所示,结合向量加法的三角形法则,列向量
\(\alpha\)、
\(\beta\)和
\(\alpha+\beta\)可以构成一个三角形。
图 5.1.10. 向量加法的三角形法则
定理 5.1.11. 三角不等式.
对任意的\(\alpha ,\beta\in \R^n\),总有
\begin{equation*}
\|\alpha+\beta\| \le \|\alpha\| +\|\beta\|.
\end{equation*}
证明.
\begin{align*}
\|\alpha+\beta\|^2 \amp = (\alpha+\beta)\cdot(\alpha+\beta) \\
\amp=\alpha\cdot\alpha+\alpha\cdot\beta +\beta\cdot \alpha+\beta\cdot\beta \\
\amp=\|\alpha\|^2+2\alpha\cdot\beta+\|\beta\|^2 \\
\amp\le \|\alpha\|^2+ 2\|\alpha\|\|\beta\|+\|\beta\|^2 \\
\amp = (\|\alpha\| +\|\beta\|)^2
\end{align*}
两端同时开平方后可得结论成立。
借助长度,我们可以给出
\(\R^n\)中两点间距离的定义。先以
\(\R^3\)为例,现在把
\(\R^3\)中的两个列向量
\(\alpha\)和
\(\beta\)理解为两个点,则这两个点间的距离自然定义为连接这两个点的线段长度,这个长度恰好就是向量
\(\alpha-\beta\)的长度。将这种想法推广至
\(\R^n\),于是有下面的定义。
定义 5.1.12.
\(\R^n\)中的两个点\(\alpha\)和\(\beta\)间的距离,记做\(d(\alpha,\beta)\),定义为
\begin{equation*}
d(\alpha,\beta)\triangleq \|\alpha-\beta\|.
\end{equation*}
子节 5.1.3 内积运算与夹角
我们仍以平面图形为例。如
图 5.1.13所示,两个向量
\(\alpha\)和
\(\beta\)的
夹角指的是以这个两个向量为两边的不超过180度的角。
图 5.1.13. 两个向量的夹角
在以两个2维向量
\(\alpha\)和
\(\beta\)为邻边的三角形中(如
图 5.1.14所示),根据中学时学过的余弦定理,
\begin{equation*}
\|\alpha-\beta\|^2 = \|\alpha\|^2+\|\beta\|^2 -2\|\alpha\|\|\beta\|\cos\theta.
\end{equation*}
将等式左端长度用内积表示,然后展开可得
\begin{equation*}
\|\alpha\|^2- 2\alpha\cdot\beta+\|\beta\|^2
= \|\alpha\|^2+\|\beta\|^2 -2\|\alpha\|\|\beta\|\cos\theta.
\end{equation*}
整理后可得
\begin{equation*}
\alpha\cdot\beta = \|\alpha\|\|\beta\|\cos\theta.
\end{equation*}
利用这个式子,我们给出一般\(n\)维空间中两个向量夹角的定义。
图 5.1.14. 向量减法的三角形法则
定义 5.1.15.
设\(\alpha,\beta\in \R^n\),\(0\le \theta\le \pi\)。若\(\theta\)满足
\begin{equation*}
\cos\theta = \frac{\alpha\cdot\beta}{\|\alpha\|\|\beta\|},
\end{equation*}
则称\(\theta\)是\(\alpha\)和\(\beta\)的夹角。
Cauchy不等式保证了
\begin{equation*}
-1\le \frac{\alpha\cdot\beta}{\|\alpha\|\|\beta\|}\le 1,
\end{equation*}
从而保证了夹角定义的合理性。
例 5.1.16.
计算向量
\(\alpha = (1,0,1)^T\)和
\(\beta = (0,1,1)^T\)的夹角。
解答.
按照公式:
\begin{equation*}
\cos\theta = \frac{\alpha\cdot\beta}{\|\alpha\|\|\beta\|} = \frac{1}{2},
\end{equation*}
所以夹角为\(\frac{\pi}{3}\)。
另一方面,可以验证:坐标原点
\(O =(0,0,0)^T\)、
\(\alpha\)、
\(\beta\)这3个点在空间中可以构成一个等边三角形,从另一个角度说明了公式的正确性。
两个向量的夹角是由向量的方向决定的,结合向量的单位化,对于非0向量,其夹角公式也可被改写为:
\begin{equation*}
\cos\theta =e_{\alpha}\cdot e_{\beta}.
\end{equation*}
练习 5.1.4 练习
基础题.
1.
2.
记
\begin{equation*}
u = \begin{pmatrix}
-1\\2
\end{pmatrix},\ v = \begin{pmatrix}
4\\6
\end{pmatrix},\ w = \begin{pmatrix}
3\\-1\\-5
\end{pmatrix},\ x = \begin{pmatrix}
6\\-2\\3
\end{pmatrix},
\end{equation*}
计算
-
\(u \cdot u\),
\(v \cdot u\)和
\(\dfrac{v \cdot u}{u \cdot u}\);
-
\(w \cdot w\),
\(x \cdot w\)和
\(\dfrac{x \cdot w}{w \cdot w}\);
-
\(\dfrac{1}{w \cdot w}w\),
\(\dfrac{1}{u \cdot u}u\);
-
\(\left( \dfrac{u \cdot v}{v \cdot v}\right) v\)、
\(\left( \dfrac{x \cdot w}{x \cdot x}\right) x\);
-
3.
将下列向量单位化:
\begin{equation*}
u = \begin{pmatrix}
-3\\4
\end{pmatrix},\ v = \begin{pmatrix}
8/3\\ 2
\end{pmatrix},\ w = \begin{pmatrix}
6\\4\\3
\end{pmatrix},\ x \begin{pmatrix}
7/4\\1/2\\1
\end{pmatrix}.
\end{equation*}
4.
求下列每组向量间的距离和夹角:
-
\(x = \begin{pmatrix}
10\\-3
\end{pmatrix}\)和
\(y = \begin{pmatrix}
-1\\-5
\end{pmatrix}\);
-
\(u = \begin{pmatrix}
0\\-5\\2
\end{pmatrix}\)和
\(v = \begin{pmatrix}
-4\\-1\\8
\end{pmatrix}\)。
提高题.
5.
平行四边形法则:设\(u,v\)都是标准内积空间\(\R^n\)中对向量,则
\begin{equation*}
\|u+v\|^2+\|u-v\|^2 = 2\left(\|u\|^2 +\|v\|^2 \right).
\end{equation*}
6.
设\(A\in \R^{m\times n}\)、\(B \in \R^{m\times n}\)是两个同阶矩阵,证明不等式:
\begin{equation*}
\left({\rm tr}(AB^T)\right)^2\le {\rm tr}(AA^T){\rm tr}(BB^T).
\end{equation*}
7.
设\(\alpha \)、\(\beta \)和\(\gamma\)是标准内积空间\(\mathbb{R}^n\)中的向量,求证:
-
当
\(\alpha\ne \beta\)时,
\(d(\alpha,\beta) > 0\);
-
\(d(\alpha,\beta)=d(\beta,\alpha) \);
-
\(d(\alpha,\beta)\le d(\alpha,\gamma)+d(\gamma,\beta)\)。