主要内容

高等代数 多项式与线性代数

6.2 坐标与基变换

在第6.1节中,我们看到列向量空间是一般线性空间的一个特例。 通过本节的讨论,我们将看到列向量空间其实不是一般的特例,它其实抓住了一般有限维线性空间的本质。
首先,我们将介绍一种将有限维线性空间中的向量转换为列向量的一般性方式。

子节 6.2.1 坐标

\(V\)是数域\(\F\)上的\(n\)维线性空间,\((\xi_{1}, \ldots, \xi_{n})\)\(V\)的一组基。 由基的定义(见定义4.4.11),任意\(\alpha \in V\)可由基向量线性表出为
\begin{equation*} \alpha = c_{1} \xi_{1} + \cdots + c_{n} \xi_{n}, \quad c_{1}, \ldots, c_{n} \in \F, \end{equation*}
且表示方式唯一。

定义 6.2.1.

\((c_{1}, \ldots, c_{n})^T\)\(V\)中向量\(\alpha\)在基\((\xi_{1}, \ldots, \xi_{n})\)下的坐标,形式上记为
\begin{equation} \alpha = (\xi_{1}, \ldots, \xi_{n}) \begin{pmatrix}c_{1} \\ \vdots \\ c_{n}\end{pmatrix}.\tag{6.2.1} \end{equation}

备注 6.2.2.

由于向量\(\alpha\)由基\((\xi_{1}, \ldots, \xi_{n})\)线性表出的方式唯一,所以向量在一组基下的坐标具有唯一性。
直观上来说,在线性空间\(V\)中确定一组基类似于选定一个坐标系。一旦坐标系确定,线性空间中的每个向量都可以由其坐标唯一标识。例如,我们所熟悉的三维空间中的直角坐标系。

6.2.3.

若在\(\R^{3}\)中取\(((1,0,0)^T, (0,1,0)^T, (0,0,1)^T)\)作为一组基,则\(\R^{3}\)中的任意向量\((x,y,z)^T\)在该组基下的坐标就是其自身\((x,y,z)^T\)
我们也可以选择非标准单位向量作为基。此时,参考的坐标系变化了,坐标也随之改变。

6.2.4.

若在\(\R^{3}\)中取\(((1,0,0)^T, (1,1,0)^T, (1,1,1)^T)\)作为一组基,则\(\R^{3}\)中的任意向量\((x,y,z)^T\)在这一组新的基下的坐标变为\((x-y,y-z,z)^T\)
由此可见,向量的坐标依赖于具体的基。在不同的基下,坐标不同。
最后,我们再讨论一个非列向量空间的例子。

6.2.5.

\(V = \F^{2 \times 2}\)\(\F\)上的线性空间,可以验证\((E_{11}, E_{12}, E_{21}, E_{22})\)\((E_{11}, E_{11}+ E_{12}, E_{21}, E_{22})\)都是\(V\)的基,其中\(E_{ij}= \varepsilon_{i} \varepsilon_{j}^T \in \F^{2 \times 2}, i,j = 1,2\)
\(A = \begin{pmatrix}1 & -1 \\ 0 & 1\end{pmatrix} \in \F^{2 \times 2}\),则
  • \(A\)在基\((E_{11}, E_{12}, E_{21}, E_{22})\)下的坐标为\((1,-1,0,1)^T\)
  • \(A\)在基\((E_{11}, E_{12}, E_{22}, E_{21})\)下的坐标为\((1,-1,1,0)^T\)
  • \(A\)在基\((E_{11}, E_{11}+ E_{12}, E_{21}, E_{22})\)下的坐标为\((2,-1,0,1)^T\)

子节 6.2.2 从向量到坐标的映射

从直观上来说,坐标可以作为一个向量的唯一标识。这一点可以用严格的数学语言来描述,即我们可以建立起向量到坐标的双射(或称一一映射,见定义B.2.29)。

证明.

首先证明映射\(\varphi\)是满射。对于任意\((c_{1}, \ldots, c_{n})^T \in \F^{n}\),我们可以构造向量\(\alpha = c_{1} \xi_{1} + \cdots + c_{n} \xi_{n}\)。由\(\varphi\)的定义有\(\varphi(\alpha) = (c_{1}, \ldots, c_{n})^T\),即任意\(\F^{n}\)中的列向量都可以找到\(\varphi\)下的原像。
接着证明\(\varphi\)是单射。设\(\alpha_{1} \neq \alpha_{2} \in V\)。由于\((\xi_{1}, \ldots, \xi_{n})\)是一组基,不同的向量在该组基下的表出方式必然不同。从而\(\alpha_{1}\)\(\alpha_{2}\)在基\((\xi_{1}, \ldots, \xi_{n})\)下的坐标不同。所以\(\varphi(\alpha_{1}) \neq \varphi(\alpha_{2})\)
从向量到其坐标的映射不仅建立了两者间的一一对应关系,还具有很好的代数性质。

证明.

首先证明\(\varphi\)保持加法运算。设\(\alpha\)的坐标为\((a_{1}, \ldots, a_{n})^T\)\(\beta\)的坐标为\((b_{1}, \ldots, b_{n})^T\),即
\begin{equation*} \alpha = a_{1} \xi_{1} + \cdots + a_{n} \xi_{n}, \end{equation*}
\begin{equation*} \beta = b_{1} \xi_{1} + \cdots + b_{n} \xi_{n}. \end{equation*}
所以,\(\alpha + \beta\)由基\((\xi_{1}, \ldots, \xi_{n})\)线性表出的唯一方式可写成
\begin{equation*} \alpha + \beta = (a_{1}+b_{1}) \xi_{1} + \cdots + (a_{n} + b_{n}) \xi_{n}, \end{equation*}
\((a_{1}+b_{1}, \ldots, a_{n} + b_{n})^T\)\(\alpha + \beta\)的坐标。由\(\varphi\)的定义,
\begin{align*} \varphi(\alpha + \beta) \amp = (a_{1}+b_{1}, \ldots, a_{n} + b_{n})^T \\ \amp = (a_{1}, \ldots, a_{n})^T + (b_{1}, \ldots, b_{n})^T \\ \amp = \varphi(\alpha) + \varphi(\beta). \end{align*}
接着证明\(\varphi\)保持加法运算。设\(c \in \F\),则
\begin{equation*} c \alpha = c a_{1} \xi_{1} + \cdots + c a_{n} \xi_{n}, \end{equation*}
\((c a_{1}, \ldots, c a_{n})^T\)\(c \alpha\)的坐标。由\(\varphi\)的定义,
\begin{align*} \varphi(c\alpha)\amp = (c a_{1}, \ldots, c a_{n})^T \\ \amp = c (a_{1}, \ldots, a_{n})^T \\ \amp = c \varphi(\alpha). \end{align*}

备注 6.2.8.

加法和数乘运算统称线性运算。保持线性运算的映射也被称为线性映射,是本章重点关注的对象之一,我们将在第6.3节中进一步讨论。
由上述讨论可知,线性空间中的向量与其坐标不但有一一对应关系,相应的映射还能保持线性运算。因此,一般有限维线性空间中与线性代数有关的结构和性质的讨论都可以等价地转化到列向量空间中进行。例如,下面的推论6.2.9表明向量组的线性相关性可以等价地转化为相应坐标列向量组的线性相关性来讨论。 这也印证了本节开篇所提到的,列向量空间抓住了一般有限维线性空间的本质。

证明.

向量组\(\alpha_{1}, \ldots, \alpha_{m}\)线性无关当且仅当
\begin{equation*} 0 = k_{1} \alpha_{1} + \cdots + k_{m} \alpha_{m} \end{equation*}
只有零解\(k_{1} = \cdots = k_{m} = 0\)。注意到零向量的坐标为\((0,\ldots,0)^T\),根据定理6.2.7得等价的充要条件为
\begin{equation*} \begin{pmatrix}0 \\ \vdots \\ 0\end{pmatrix} = k_{1} \begin{pmatrix}c_{11}\\ \vdots \\ c_{n1}\end{pmatrix} + \cdots + k_{m} \begin{pmatrix}c_{m1}\\ \vdots \\ c_{mn}\end{pmatrix} \end{equation*}
只有零解\(k_{1} = \cdots = k_{m} = 0\),即坐标向量组线性无关。

子节 6.2.3 基变换与过渡矩阵

一个线性空间中的基可能有很多不同的选择,本小节讨论不同基之间的关系。 考虑\(n\)线性空间\(V\)中的任意两组基:\((\xi_{1}, \ldots, \xi_{n})\)\((\eta_{1}, \ldots, \eta_{n})\)。 由基的定义,\((\eta_{1}, \ldots, \eta_{n})\)中的每个向量都可由基\((\xi_{1}, \ldots, \xi_{n})\)线性表出,即
\begin{equation} \begin{array}{c} \eta_{1} = c_{11}\xi_{1} +c_{21}\xi_{2} + \cdots + c_{n1}\xi_{n}\\ \eta_{2} = c_{12}\xi_{1} +c_{22}\xi_{2} + \cdots + c_{n2}\xi_{n} \\ \vdots \\ \eta_{n} = c_{1n}\xi_{1} +c_{2n}\xi_{2} + \cdots + c_{nn}\xi_{n}, \end{array}\tag{6.2.2} \end{equation}
其中\((c_{1i}, c_{2i}, \ldots, c_{ni})^T\)\(\eta_{i}\)在基\((\xi_{1}, \ldots, \xi_{n})\)下的坐标。 上述基之间的线性表出关系(6.2.2) 可在形式上记为
\begin{equation*} (\eta_{1}, \ldots, \eta_{n}) = (\xi_{1}, \ldots, \xi_{n}) \begin{pmatrix}c_{11}&c_{12}&\cdots&c_{1n}\\ c_{21}&c_{22}&\cdots&c_{2n}\\ \vdots&\vdots&\ddots&\vdots \\ c_{n1}&c_{n2}&\cdots&c_{nn}\end{pmatrix}. \end{equation*}
称将\(\eta_{1}, \ldots, \eta_{n}\)的坐标作为列向量依次排列得到的矩阵
\begin{equation*} T = \begin{pmatrix}c_{11}&c_{12}&\cdots&c_{1n}\\ c_{21}&c_{22}&\cdots&c_{2n}\\ \vdots&\vdots&\ddots&\vdots \\ c_{n1}&c_{n2}&\cdots&c_{nn}\end{pmatrix} \end{equation*}
为从基\((\xi_{1}, \ldots, \xi_{n})\)到基\((\eta_{1}, \ldots, \eta_{n})\)过渡矩阵

备注 6.2.10.

任意两组基之间都存在过渡矩阵。
过渡矩阵的一个重要特点是可逆性。

证明.

\((\eta_{1}, \ldots, \eta_{n})\)\(V\)的基,因此基向量组线性无关。根据推论6.2.9\(\eta_{1}, \ldots, \eta_{n}\)的坐标向量组线性无关,即过渡矩阵\(T\)的列向量组线性无关。最后,由命题4.3.25知,\(T\)可逆。
从另一方面来说,任何一个\(n\)阶可逆矩阵都可以作为基\((\xi_{1}, \ldots, \xi_{n})\)到另一组基的过渡矩阵。

证明.

由于\(T\)是可逆矩阵,由命题4.3.25\(T\)的列向量组线性无关,即\(\eta_{1}, \ldots, \eta_{n}\)的坐标向量组线性无关。再根据推论6.2.9\(\eta_{1}, \ldots, \eta_{n}\)线性无关。最后,因\(V\)的维数为\(n\),依定理4.4.16\((\eta_{1}, \ldots, \eta_{n})\)\(V\)的基。

子节 6.2.4 坐标变换

在不同的两组基下,一个向量有不同的坐标。下面的定理表明过渡矩阵可以作为桥梁联系这两个坐标。

证明.

由已知,\((y_{1}, \ldots, y_{n})^T\)\(\alpha\)\((\eta_{1}, \ldots, \eta_{n})\)下的坐标,即
\begin{equation} \alpha = y_{1} \eta_{1} + \cdots + y_{n} \eta_{n}.\tag{6.2.3} \end{equation}
设过渡矩阵
\begin{equation*} T = \begin{pmatrix}c_{11}&c_{12}&\cdots&c_{1n}\\ c_{21}&c_{22}&\cdots&c_{2n}\\ \vdots&\vdots&\ddots&\vdots \\ c_{n1}&c_{n2}&\cdots&c_{nn}\end{pmatrix}, \end{equation*}
\begin{align*} \eta_{1} = c_{11}\xi_{1} + \amp c_{21}\xi_{2} + \cdots + c_{n1}\xi_{n},\\ \amp \vdots \\ \eta_{n} = c_{1n}\xi_{1} +\amp c_{2n}\xi_{2} + \cdots + c_{nn}\xi_{n} \end{align*}
代入 (6.2.3)
\begin{align*} \alpha = \amp y_{1} (c_{11}\xi_{1} + \cdots + c_{n1}\xi_{n}) + \cdots + y_{n} (c_{1n}\xi_{1} + \cdots + c_{nn}\xi_{n}) \\ = \amp (y_{1} c_{11}+ \cdots + y_{n} c_{1n}) \xi_{1} + \cdots + (y_{1} c_{n1}+ \cdots + y_{n} c_{nn}) \xi_{n}. \end{align*}
由坐标的唯一性知
\begin{align*} \amp\left\{\begin{array}{c} x_{1} = y_{1} c_{11}+ \cdots + y_{n} c_{1n}, \\ \vdots \\ x_{n} = y_{1} c_{n1}+ \cdots + y_{n} c_{nn}, \end{array} \right. \\ \quad \iff \quad \amp \begin{pmatrix}x_{1} \\ \vdots \\ x_{n}\end{pmatrix} = T \begin{pmatrix}y_{1} \\ \vdots \\ y_{n}\end{pmatrix}. \end{align*}

备注 6.2.14.

通过形式记号,上述证明可简化为
\begin{equation*} \begin{cases}&(\eta_{1}, \ldots, \eta_{n}) = (\xi_{1}, \ldots, \xi_{n}) T \\&\alpha = (\eta_{1}, \ldots, \eta_{n}) Y\end{cases} \quad \implies \quad \alpha = (\xi_{1}, \ldots, \xi_{n}) T Y. \end{equation*}