主要内容

高等代数 多项式与线性代数

4.3 生成子空间、极大无关组与秩

本节中我们从列向量的角度来进一步理解线性方程组何时有解。设\(AX=\beta\)是一个线性方程组,\(\alpha_1,\dots,\alpha_n\)\(A\)的列向量组,可知线性方程组有解的充分必要条件是 \(\beta\)\(\alpha_1,\dots,\alpha_n\)的一个线性组合。若我们可以对列向量组\(\alpha_1,\dots,\alpha_n\)的所有线性组合构成的集合有一个整体性的理解,则只需判断\(\beta\)是否落在这个集合内就可以判断线性方程组是否有解。接下来我们就沿着这个思路来展开讨论。

子节 4.3.1 生成子空间

我们来考察下面的集合:
\begin{equation*} {\rm Im} A\triangleq \{c_1\alpha_1+\dots+c_n\alpha_n| c_1,\ldots,c_n\in \F \}, \end{equation*}
即列向量组\(\alpha_1,\ldots,\alpha_n\)的所有线性组合所构成的集合。接下来先通过几个具体的例子来熟悉一下这个集合。

4.3.1.

求下列矩阵对应的\({\rm Im} A\)
  1. \(\displaystyle A= \begin{pmatrix} 1 \\ 1 \end{pmatrix},\)
  2. \(\displaystyle A= \begin{pmatrix} 1 & 2 \\ 1 & 2 \end{pmatrix},\)
  3. \(\displaystyle A= \begin{pmatrix} 1 & 2 \\ 1 & -2 \end{pmatrix},\)
  4. \(\displaystyle A= \begin{pmatrix} 1 & 2 & 3 \\ 1 & -2 & 4\\ 0 & 0& 0 \end{pmatrix}.\)
解答.
  1. \({\rm Im} A = \left\{\left.c\begin{pmatrix} 1 \\ 1 \end{pmatrix} \right| c\in \F \right\}\)。特别地当\(\F=\R\)时,\({\rm Im} A\)是坐标平面上1、3象限角分线。
  2. 与1完全相同。
  3. \({\rm Im} A =\F^2\)。对一般的\((x,y)^T\in \F^2\)
    \begin{equation*} \begin{pmatrix} x\\y \end{pmatrix} = \frac{x+y}{2}\cdot\begin{pmatrix} 1\\1 \end{pmatrix} +\frac{x-y}{4}\cdot\begin{pmatrix} 2\\-2 \end{pmatrix}\in {\rm Im} A. \end{equation*}
  4. \({\rm Im} A =\left\{\left.\begin{pmatrix} x\\y\\0 \end{pmatrix}\right|x,y\in \F\right\}\)。当\(\F=\R\)时,\({\rm Im} A\)是空间坐标系中的xoy平面。
有如下一个简单但重要的观察。

观察 4.3.2.

集合\({\rm Im} A\) 对列向量的加法和数乘封闭。
注意到与一般集合相区别,列向量空间本质上重要的是其由加法和数乘引入的结构,即列向量间的线性关系。而由于有封闭性,向量的加法和数乘也可以局限定义在\({\rm Im} A\)上。于是我们可以引入如下定义。

定义 4.3.3.

\(\alpha_1,\ldots,\alpha_n\)\(\F^m\)中的列向量组。称集合
\begin{equation*} \{c_1\alpha_1+\dots+c_n\alpha_n| c_1,\ldots,c_n\in \F \} \end{equation*}
为由\(\alpha_1,\ldots,\alpha_n\) 生成的子空间,或也称为向量组\(\alpha_1,\ldots,\alpha_n\)生成子空间,记做 \(\langle \alpha_1,\ldots,\alpha_n\rangle\)
特别地,一个矩阵\(A\)的列向量组生成的子空间也称为\(A\)列空间,记做\({\rm Im} A\)

备注 4.3.4.

记号\({\rm Im} A\)章 6中将做进一步解释。
有了上述定义后,线性方程组解的存在性问题可以做如下转化。

子节 4.3.2 极大无关组

例 4.3.1中可以看到:生成 \(\langle \alpha_1,\ldots,\alpha_n \rangle\) 时并不一定需要这个向量组中的所有列向量。一个自然的问题:如何用最少的列向量生成相同的生成子空间?这些向量需要满足什么条件?
若向量组中的某一个向量可以被其它向量线性表出,比方说
\begin{equation} \alpha_n = d_1\alpha_1+\dots+ d_{n-1}\alpha_{n-1},\tag{4.3.1} \end{equation}
其中 \(d_1,\dots,d_{n-1}\)是一些常数。将 (4.3.1)带入到 \(\alpha_1,\dots,\alpha_n\)一般的线性组合中得
\begin{equation*} \sum_{i=1}^n c_i\alpha_i = \sum_{i=1}^{n-1}(c_i+c_nd_i)\alpha_i, \end{equation*}
即任意\(\alpha_1,\dots,\alpha_n\)的线性组合都可以被\(\alpha_1,\dots,\alpha_{n-1}\)线性表出,也就是说这个可被线性表出的 \(\alpha_n\)不是必要的。注意到线性相关的向量组中都有向量可以被其余向量线性表出,所以选择最少向量生成\(\langle \alpha_1,\ldots,\alpha_n \rangle\)时,我们需要的是线性无关的向量组。于是可以引入下面的术语。

定义 4.3.6.

若向量组\(\alpha_1,\dots ,\alpha_s\)的子向量组\(\alpha_{i_1},\alpha_{i_2},\dots ,\alpha_{i_r}\)满足:
  1. \(\alpha_{i_1},\alpha_{i_2},\dots ,\alpha_{i_r}\)线性无关;
  2. 将原向量组中任意一个向量添加到\(\alpha_{i_1},\alpha_{i_2},\dots ,\alpha_{i_r}\)得到的\(r +1\)个向量线性相关,
则称\(\alpha_{i_1},\alpha_{i_2},\dots ,\alpha_{i_r}\)是向量组\(\alpha_1,\dots ,\alpha_s\)的一个极大线性无关组,简称为极大无关组

4.3.7.

  1. 对于所有向量都是零向量构成的向量组(0矩阵的列向量组),约定其极大无关组为空集,也可以理解为其没有极大线性无关组。
  2. 若向量组\(\alpha_1,\alpha_2,\dots,\alpha_s\)线性无关,则\(\alpha_1,\alpha_2,\dots,\alpha_s\)的极大无关组就是其自身。
  3. \(\mathbb{R}^2\)中,\(\alpha_1=(1,0)^T\)\(\alpha_2=(0,1)^T\)\(\alpha_3=(1,1)^T\), 则
    • \(\alpha_1,\alpha_2\)是向量组\(\alpha_1,\alpha_2,\alpha_3\)的一个极大无关组;
    • \(\alpha_1,\alpha_3\)是向量组\(\alpha_1,\alpha_2,\alpha_3\)的一个极大无关组;
    • \(\alpha_2,\alpha_3\)是向量组\(\alpha_1,\alpha_2,\alpha_3\)的一个极大无关组。
    可见同一个向量组的极大无关组并不一定唯一。
对于给定的向量组\(S=\{ \alpha_1,\dots ,\alpha_s\}\),我们可以按照下面的步骤获得它的一个极大无关组:
  1. 初始化一个线性无关的子向量组\(R =\emptyset\)
  2. ​按从前到后的顺序检查每个向量\(\alpha_k,k=1,\dots,s\)
    • \(\alpha_k\)无法被当前的\(R\)中向量表示,则将\(\alpha_k\)添加到\(R\)中,即\(R\leftarrow R\cup \{\alpha_k\}\)(根据 定理 4.2.13,添加之后的子向量组\(R\)必然还是线性无关的);
    • 否则,跳过\(\alpha_k\)
上述过程中止后获得的子向量组\(R\)必然是一个极大无关组。这也说明了极大无关组的存在性。
上述过程第2步中按从前到后的顺序只是为了保证每个向量都被检查到,向量组中向量的排列次序完全不重要。事实上,我们有如下一个常用结论。
关于极大无关组有下面的结论。

证明.

易知\(\langle \alpha_{i_1},\dots,\alpha_{i_r}\rangle\subseteq \langle \alpha_1,\dots,\alpha_s\rangle\)成立,下面着重证明反向包含。
根据极大无关组的定义,对任意的\(j=1,\dots,s\), 向量组\(\alpha_{i_1},\dots,\alpha_{i_r},\alpha_j\)线性相关,根据定理 4.2.13\(\alpha_j\)可以被\(\alpha_{i_1},\dots,\alpha_{i_r}\)线性表出,于是可以记
\begin{equation*} \alpha_j = b_{1j}\alpha_{i_1}+\cdots +b_{rj}\alpha_{i_r}= (\alpha_{i_1},\dots,\alpha_{i_r})\begin{pmatrix} b_{1j}\\\vdots\\ b_{rj} \end{pmatrix}. \end{equation*}
记矩阵\(B =(b_{ij})_{r\times s} \),则按列分块把所有\(\alpha_j\)拼在一起,可得
\begin{equation} (\alpha_1,\dots,\alpha_s) = (\alpha_{i_1},\dots,\alpha_{i_r})B.\tag{4.3.2} \end{equation}
对任意的\(\gamma \in \langle \alpha_1,\dots,\alpha_s\rangle \),根据定义,
\begin{equation*} \gamma =c_1\alpha_1+\cdots +c_s\alpha_s = (\alpha_1,\dots,\alpha_s)\begin{pmatrix} c_{1}\\\vdots\\ c_{s} \end{pmatrix}. \end{equation*}
(4.3.2)代入得
\begin{equation*} \gamma = (\alpha_{i_1},\dots,\alpha_{i_r})B_{r\times s}\begin{pmatrix} c_{1}\\\vdots\\ c_{s} \end{pmatrix}, \end{equation*}
\begin{equation*} \begin{pmatrix} d_{1}\\\vdots\\ d_{r} \end{pmatrix}=B_{r\times s} \begin{pmatrix} c_{1}\\\vdots\\ c_{s} \end{pmatrix}, \end{equation*}
\begin{equation*} \gamma=d_1\alpha_{i_1}+\cdots+d_r\alpha_{i_r}\in \langle \alpha_{i_1},\dots,\alpha_{i_r}\rangle, \end{equation*}
可推知
\begin{equation*} \langle \alpha_1,\dots,\alpha_s\rangle\subseteq \langle \alpha_{i_1},\dots,\alpha_{i_r}\rangle. \end{equation*}
于是结论成立。
接下来的问题是如何求一个向量组的极大无关组。在前面给出的算法中,对于一般的向量组,判断\(\alpha_k\)是否可以被\(R\)中向量线性表出并不是非常直观。注意到初等行变换不改变列向量组的线性关系,因此可以先通过初等行变换化简,然后再来求极大无关组。我们通过一个例子来具体说明。

4.3.10.

\(\alpha_1 =(2,1,3,0,4)^T \)\(\alpha_2 =(-1,2,3,1,0)^T \)\(\alpha_3 =(3,-1,0,-1,4)^T \)
  1. \(\alpha_1,\alpha_2,\alpha_3\)的一个极大线性无关组;
  2. 将其余向量表示为该极大无关组的线性组合。
解答.
因为初等行变换不改变列向量组的线性关系,我们可以把\(\alpha_1,\alpha_2,\alpha_3\)拼成矩阵\(A\),用初等行变换将\(A\)化简为简化阶梯行矩阵,然后针对简化阶梯形矩阵的列向量组来求极大无关组,这样获得的结果可以直接推出\(\alpha_1,\alpha_2,\alpha_3\)的相关结论。具体的:
\begin{align*} (\alpha_1,\alpha_2,\alpha_3) = \amp\begin{pmatrix} 2 & -1 & 3\\ 1 & 2 & -1\\ 3 & 3 & 0\\ 0 & 1 & -1\\ 4 & 0 & 4 \end{pmatrix}\phantom{\triangleq (\beta_1,\beta_2,\beta_3) } \\ \xrightarrow{\text{初等}{\color{red}\text{行}}\text{变换} } \amp \begin{pmatrix} 1 & 0 & 1\\ 0 & 1 & -1\\ 0 & 0 & 0\\ 0 & 0 & 0\\ 0 & 0 & 0 \end{pmatrix} \triangleq (\beta_1,\beta_2,\beta_3) \end{align*}
  1. 易知\(\beta_1,\beta_2\)是向量组 \(\beta_1,\beta_2,\beta_3\)的极大无关组,由于\(\alpha_1,\alpha_2,\alpha_3\)向量组与\(\beta_1,\beta_2,\beta_3\)有相同的线性关系,所以\(\alpha_1,\alpha_2\)是向量组\(\alpha_1,\alpha_2,\alpha_3\)的极大无关组;
  2. 易知\(\beta_3 = \beta_1-\beta_2\),所以\(\alpha_3=\alpha_1-\alpha_2\)
上述例子中的方法具有一般性。

子节 4.3.3 向量组的秩与线性表出

上一小节中的定理 4.3.9说明向量组和其极大无关组生成的子空间是一样的,一定程度上提醒我们不同的向量组可以生成相同的子空间。本小节中我们讨论:生成相同子空间的两个向量组需要满足什么条件。
结合 定理 4.2.13, 极大无关组定义中的第二个条件 项 2也可表述为 \(\alpha_1,\dots,\alpha_n\)中的任意一个向量都可以被 \(\alpha_{i_1},\dots,\alpha_{i_r}\)线性表出。我们来扩展研究一下这种性质。

定义 4.3.11.

\(\alpha_1,\dots ,\alpha_s\)\(\beta_1,\dots ,\beta_t\)都是\(\mathbb{F}^m\)中的向量组。 若\(\alpha_1,\dots ,\alpha_s\)中的每个向量都可由\(\beta_1,\dots ,\beta_t\)线性表出,则称向量组\(\alpha_1,\dots ,\alpha_s\)可由向量组\(\beta_1,\dots ,\beta_t\)线性表出;若向量组\(\alpha_1,\dots ,\alpha_s\)和向量组\(\beta_1,\dots ,\beta_t\)可以互相线性表出, 则称向量组\(\alpha_1,\dots ,\alpha_s\)\(\beta_1,\dots ,\beta_t\)等价
例如,若向量组\(\alpha_1,\alpha_2\)\(\beta_1,\beta_2\)满足:
\begin{equation*} \left\{\begin{array}{l} \beta_1=\alpha_1-\alpha_2,\\ \beta_2 = \alpha_1+\alpha_2,\\ \end{array} \right. \end{equation*}
则由定义可知\(\beta_1,\beta_2\)可由\(\alpha_1,\alpha_2\)线性表出。另一方面,稍作变形可知
\begin{equation*} \left\{\begin{array}{l} \alpha_1=\frac{1}{2}\beta_1+\frac{1}{2}\beta_2,\\ \alpha_2 = \frac{1}{2}\beta_1-\frac{1}{2}\beta_2,\\ \end{array} \right. \end{equation*}
\(\alpha_1,\alpha_2\)也可由\(\beta_1,\beta_2\)线性表出。二者结合可知\(\alpha_1,\alpha_2\)\(\beta_1,\beta_2\)等价。
一般地,如果向量组\(\alpha_1,\dots ,\alpha_s\)可由向量组\(\beta_1,\dots ,\beta_t\)线性表出,则对每一个\(\alpha_j, j=1,\dots,s \),都有
\begin{equation*} \alpha_j = a_{1j}\beta_1+\cdots+a_{tj}\beta_t=(\beta_1,\dots ,\beta_t)\begin{pmatrix} a_{1j}\\ \vdots\\ a_{tj} \end{pmatrix} , \end{equation*}
类似于我们在定理定理 4.3.9证明中的做法,记\(A = (a_{ij})_{t\times s}\),将上述等式按列拼在一起,可知下面一个常用命题成立。
利用命题 4.3.12,可以证明下面的结论。

证明.

  1. 由定义可知充分性成立,下面证明必要性。
    根据命题 4.3.12\(\alpha_1,\dots ,\alpha_s\)可由\(\beta_1,\dots ,\beta_t\)线性表出推出存在矩阵\(A\in \F^{t\times s}\),使得
    \begin{equation*} (\alpha_1,\dots ,\alpha_s) = (\beta_1,\dots ,\beta_t)A. \end{equation*}
    对任意列向量\(\gamma\in\langle \alpha_1,\dots ,\alpha_s\rangle \),根据定义
    \begin{align*} \gamma =\amp(\alpha_1,\dots,\alpha_s)\begin{pmatrix}c_1\\\vdots\\ c_s\end{pmatrix} \\ = \amp (\beta_1,\dots ,\beta_t)A\begin{pmatrix}c_1\\\vdots\\ c_s\end{pmatrix} \\ = \amp (\beta_1,\dots ,\beta_t)\begin{pmatrix}d_1\\\vdots\\ d_t\end{pmatrix} \\ = \amp d_1\beta_1+\cdots+d_t\beta_t\in \langle \beta_1,\dots ,\beta_t\rangle, \end{align*}
    其中\(\begin{pmatrix}d_1\\\vdots\\ d_t\end{pmatrix} =A\begin{pmatrix}c_1\\\vdots\\ c_s\end{pmatrix}\),于是
    \begin{equation*} \langle \alpha_1,\dots ,\alpha_s\rangle \subseteq \langle \beta_1,\dots ,\beta_t\rangle. \end{equation*}
  2. 根据结论1,\(\alpha_1,\dots ,\alpha_s\)可由\(\beta_1,\dots ,\beta_t\)线性表出等价于
    \begin{equation*} \langle \alpha_1,\dots ,\alpha_s\rangle \subseteq \langle \beta_1,\dots ,\beta_t\rangle; \end{equation*}
    同理,\(\beta_1,\dots ,\beta_t\)可由\(\alpha_1,\dots ,\alpha_s\)线性表出等价于
    \begin{equation*} \langle \beta_1,\dots ,\beta_t\rangle\subseteq\langle \alpha_1,\dots ,\alpha_s\rangle, \end{equation*}
    二者结合可知结论成立。
根据 定理 4.3.13中的第2个结论,容易验证向量组等价这种关系满足下面的性质:
  1. 反身性:\(\alpha_1,\dots ,\alpha_s\)\(\alpha_1,\dots ,\alpha_s\)等价;
  2. 对称性:若\(\alpha_1,\dots ,\alpha_s\)\(\beta_1,\dots ,\beta_t\)等价,则\(\beta_1,\dots ,\beta_t\)\(\alpha_1,\dots ,\alpha_s\)等价;
  3. 传递性: 若\(\alpha_1,\dots ,\alpha_s\)\(\beta_1,\dots ,\beta_t\)等价,\(\beta_1,\dots ,\beta_t\)\(\gamma_1,\dots ,\gamma_r\)等价,则\(\alpha_1,\dots ,\alpha_s\)\(\gamma_1,\dots ,\gamma_r\)等价。
这也说明了称之为“向量组等价”的合理性。
一般情况下,我们讨论的向量组都是有限集,而空间通常都是无限集。有限个向量构成的向量组之间的等价要比无限集空间的相等更容易把握。
结合 定理 4.3.9,可知下面的定理成立。
根据传递性,我们只需要关心线性无关向量组之间的线性表出。线性无关的向量组有很多很好的性质。

证明.

记矩阵\(A =(\alpha_1,\dots ,\alpha_s) \)\(B = (\beta_1,\dots ,\beta_t)\)。根据 命题 4.3.12,存在矩阵\(C_{t\times s}\)使得\(A=BC\)
按照定义,\(\alpha_1,\dots ,\alpha_s\)线性相关等价于线性方程组\(AX= 0\)有非0解。将\(A=BC\)代入可知\(AX= 0\)同解于\(BC_{t\times s}X=0\)。注意到\(s>t\)\(r(C)\le t <s \),根据 推论 2.6.10,所以\(CX=0\)存在非0解。而\(CX=0\)的解都是\(AX= 0\)的解,所以\(AX= 0\)有非0解,进而推出\(\alpha_1,\dots ,\alpha_s\)线性相关。
两次使用上述引理,可知下面的定理成立。
由于一个向量组的所有极大无关组都是相互等价的,所以这些极大无关组含有的向量个数都是一样的,我们给这个公共的个数一个特别的称呼。

定义 4.3.17.

向量组\(\alpha_1,\dots,\alpha_s\)的极大无关组所含向量个数称为该向量组的秩,记为\(r(\alpha_1,\dots,\alpha_s)\)

备注 4.3.18.

约定:零向量组成的向量组的秩为零。
关于向量组的秩这个重要参数,我们有如下一些常用的结论。

证明.

\(\alpha_{i_1},\ldots,\alpha_{i_r}\)\(\alpha_1,\ldots,\alpha_s\)的一个极大无关组,\(\beta_{j_1},\ldots,\beta_{j_p}\)\(\beta_1,\ldots,\beta_t\)的一个极大无关组,则\(r(\alpha_1,\ldots,\alpha_s)=r,r(\beta_1,\ldots,\beta_t)=p\),且
\begin{equation*} \langle\alpha_{i_1},\ldots,\alpha_{i_r}\rangle=\langle\alpha_1,\ldots,\alpha_s\rangle ,\ \langle\beta_{j_1},\ldots,\beta_{j_p}\rangle = \langle\beta_1,\ldots,\beta_t\rangle . \end{equation*}
已知\(\alpha_1,\dots,\alpha_s\)可由\(\beta_1,\dots ,\beta_t\)线性表出,根据定理 4.3.13\(\langle \alpha_1,\dots,\alpha_s\rangle\subseteq \langle\beta_1,\dots ,\beta_t\rangle\),故\(\langle\alpha_{i_1},\ldots,\alpha_{i_r}\rangle\subseteq \langle\beta_{j_1},\ldots,\beta_{j_p}\rangle\),由此可知\(\alpha_{i_1},\ldots,\alpha_{i_r}\)可由\(\beta_{j_1},\ldots,\beta_{j_p}\)线性表出。注意到\(\alpha_{i_1},\ldots,\alpha_{i_r}\)线性无关,根据引理 4.3.15\(r\leq p\),结论成立。
向量组等价可以推出秩相等。反之,若\(r(\alpha_1,\dots,\alpha_s)= r(\beta_1,\dots ,\beta_t)\),则\(\alpha_1,\dots,\alpha_s\)\(\beta_1,\dots ,\beta_t\)是否一定等价呢?答案是不一定。请同学们自己给出一些不等价的例子。
下面的定理证明留做思考题。

子节 4.3.4 矩阵的列秩与行秩

章 2中,我们按照线性方程组中有效方程的个数给出了矩阵秩的概念,即从行的角度理解矩阵秩这重要参数。矩阵按列分块后即可获得一个列向量组,一个列向量组也可以自然的拼成一个矩阵。接下来,我们在从列的角度重新理解矩阵的秩。

定义 4.3.22.

矩阵\(A\)列向量组的秩称为\(A\)列秩
注意到初等行变换不改变矩阵列向量组的线性关系,我们有下面的结论。

证明.

按照定义,矩阵\(A\)的列秩等于其列向量组极大无关组中含有的向量个数。由于初等行变换不改变列向量组的线性关系,所以简化阶梯形矩阵\({\rm rref}(A)\)列的极大无关组和矩阵\(A\)的列极大无关组含有相同的向量个数。
对于简化阶梯形矩阵\({\rm rref}(A)\),易知其所有的主元列恰好可以构成一个极大无关组,此时的向量个数恰好等于\({\rm rref}(A)\)中非0行的行数,即等于\(r(A)\)。综上,结论成立。
注意到 \(A^T\)的列向量组也就是转置后的 \(A\)的行向量组,我们定义:矩阵的行秩为其行向量组极大无关组中含有的向量个数。根据 定理 2.7.6中的第1条性质,转置不改变矩阵的秩,可知下面的结论成立。
回顾满秩矩阵是秩等于列数或秩等于行数的矩阵,对于方阵而言,满秩有特别的意义。
矩阵的秩还有一种理解(定义)方式与行列式有关。注意到一个方阵满秩当且其行列式不为0,我们有下面一个结论。

证明.

  1. \(A =(\alpha_1,\dots,\alpha_n)\),由于\(r(A)=r\),所以在\(A\)的列向量组中含有\(r\)个线性无关的列向量,不妨设\(\alpha_1,\dots,\alpha_r\)线性无关。记\(B =(\alpha_1,\dots,\alpha_r) \),则\(r(B)=r\)
    另一方面,从行向量的角度,\(B\)矩阵的行向量组中也存在\(r\)个线性无关的行向量,不妨设\(B\)的前\(r\)行线性无关。记\(B\)的前\(r\)行构成的矩阵为\(C\),则\(\det C\)是矩阵\(A\)\(r\)阶子式,且\(\det C\ne 0\)
  2. 用反证法证明\(A\)的任意阶数大于\(r\)的子式均为0。假设存在\(A\)\(k\)阶非0子式,其中\(k > r\),不妨设\(A\)的前\(k\)行、前\(k\)列对应的子式不为0。对\(A\)做分块,记
    \begin{equation*} A = \begin{pmatrix} A_1 & A_2\\ A_3 & A_4 \end{pmatrix}, \end{equation*}
    其中\(A_1\)\(k \times k \)阶子阵。根据假设可知\(\det A_1\ne 0\),于是\(A_1\)的列向量组线性无关。再根据 定理 4.2.12,可知\(A\)的前\(k\)列也线性无关,这就与\(r(A)=r\)相矛盾,所以假设不成立,即\(A\)的任意阶数大于\(r\)阶的子式都为0。
秩是矩阵的重要参数,有多种意义,在这里我们总结一下已经涉及到的秩的含义。
下面我们从向量组角度证明关于矩阵秩的一些常用不等式。

4.3.28. 矩阵秩与阶数.

\(A\in \mathbb{F}^{m\times n}\),证明:\(r(A)\leq\min\{m,n\}\)
解答.
\(A\)的列向量组为\(\alpha_1,\dots,\alpha_n\),由于\(r(A)\)等于列秩,即等于\(\alpha_1,\dots,\alpha_n\)的极大无关组中含有的向量个数,显然有\(r(A)\le n\)
从行向量组和行秩的角度,同理可证\(r(A)\le m\)。综合两者,可知\(r(A)\leq\min\{m,n\}\)成立。
称满足\(r(A)= m\)的矩阵\(A\)行满秩矩阵,满足\(r(A)= n\)的矩阵\(A\)列满秩矩阵

4.3.29. 拼接矩阵的秩.

证明:\(\max\{r(A),r(B)\}\leq r(A,B)\leq r(A)+r(B)\)
提示.
利用列向量组的极大无关组。
解答.
\(A\)的列向量组为\(\alpha_1,\dots,\alpha_n\)\(B\)的列向量组为\(\beta_1,\dots,\beta_p\)。分别取这两个向量组的极大无关组,记为\(\alpha_{i_1},\dots,\alpha_{i_r}\)\(\beta_{j_1},\dots,\beta_{j_s}\),其中\(r(A)=r\)\(r(B)=s\)
  • 先证明 \(r(A,B)\ge \max\{r(A),r(B)\} \):由于\(\alpha_{i_1},\dots,\alpha_{i_r}\)是分块矩阵\((A,B)\)列向量组的线性无关子向量组,所以\(r(A,B)\ge r=r(A)\)。同理可证\(r(A,B)\ge s = r(B)\)。综合可知\(r(A,B)\ge \max\{r(A),r(B)\}\)
  • 接下来证明\(r(A,B)\le r(A)+r(B)\): 根据极大无关组的性质,向量组\(\alpha_{i_1},\dots,\alpha_{i_r},\beta_{j_1},\dots,\beta_{j_s}\)可以线性表出\(\alpha_1,\dots,\alpha_n,\beta_1,\dots,\beta_p\)中的所有向量,即可以表示分块矩阵\((A,B)\)的列向量组。根据定理 4.3.19
    \begin{equation*} r(A,B)\le r(\alpha_{i_1},\dots,\alpha_{i_r},\beta_{j_1},\dots,\beta_{j_s}). \end{equation*}
    另一方面,向量组的秩显然不超过向量个数,即
    \begin{equation*} r(\alpha_{i_1},\dots,\alpha_{i_r},\beta_{j_1},\dots,\beta_{j_s})\le r+s, \end{equation*}
    所以有
    \begin{equation*} r(A,B)\le r+s= r(A)+r(B). \end{equation*}
在上例中,若特取\(B\)是只有一列的矩阵(即列向量),则结论也可以总结为: 矩阵增加一列,则秩不变或加一;若矩阵减去一列,则秩不变或减一。此结论可以帮我们从另一个角度理解增广矩阵的秩与系数矩阵秩的关系。
下面是矩阵加法运算和乘法运算对矩阵秩的影响。

4.3.30. 和矩阵秩的上界.

证明:\(r(A+B)\leq r(A)+r(B)\)
解答.
\(A,B\)的列向量组分别为\(\alpha_1,\dots,\alpha_n\)\(\beta_1,\dots,\beta_n\)\(n\)为矩阵的列数)。则\(A+B\)列向量组\(\alpha_1+\beta_1,\dots,\alpha_n+\beta_n\)中的向量都是向量组\(\alpha_1,\dots,\alpha_n,\beta_1,\dots,\beta_n\)的线性组合,即\(A+B\)的列向量可以被分块矩阵\((A,B)\)的列向量线性表出,根据定理 4.3.19例 4.3.29
\begin{equation*} r(A+B)\le r(A,B)\le r(A)+r(B). \end{equation*}

4.3.31. 乘积矩阵秩的上界.

证明:\(r(AB)\leq \min\{r(A),r(B)\}\)
解答.
根据命题 4.3.12,矩阵\(AB\)的列向量组可以由矩阵\(A\)的列向量组线性表出,根据定理 4.3.19,可知
\begin{equation*} r(AB)\le r(A). \end{equation*}
由于转置不改变矩阵的秩,把\(B^T\)看作新的\(A\),利用刚证明的结论,有
\begin{equation*} r(AB) = r(B^TA^T)\le r(B^T) = r(B). \end{equation*}
综合可知结论成立。
接下来的定理称为矩阵乘法的Sylvester不等式,它给出了乘积矩阵秩的下界。此定理有多种不同的证明方法,下面我们从向量组的角度给出一个证明。

证明.

\(r(A)= r\)\(r(B)= s\)。根据定理 2.7.5,存在可逆矩阵\(P_{m\times m}\)\(Q_{n\times n}\),使得
\begin{equation*} PAQ = \begin{pmatrix} E_r & 0\\ 0 & 0 \end{pmatrix}. \end{equation*}
由于初等变换不改变矩阵的秩,左乘或右乘可逆矩阵也不改变矩阵的秩,所以
\begin{equation*} r(AB) = r(PAQQ^{-1}B)=r\left(\begin{pmatrix} E_r & 0\\ 0 & 0 \end{pmatrix}Q^{-1}B\right). \end{equation*}
\(Q^{-1}B\)作行分块,记为
\begin{equation*} Q^{-1}B = \begin{pmatrix} \beta_1^T\\\vdots\\ \beta_r^T\\ \beta_{r+1}^T\\ \vdots \\ \beta_n^T \end{pmatrix}. \end{equation*}
由于\(r(B)=s\),所以\(r(Q^{-1}B)=s\),即在\(Q^{-1}B\)的行向量组中存在\(s\)个线性无关的行向量\(\beta_{i_1}^T,\dots,\beta_{i_s}^T\)。这\(s\)个线性无关的行向量落在后\(n-r\)行的向量最多有\(n-r\)个,所以落在前\(r\)行中的向量个数至少有\(s-(n-r)= r+s-n\)个。这些落在前\(r\)行中的向量线性无关,且也是矩阵
\begin{equation*} \begin{pmatrix} E_r & 0\\ 0 & 0 \end{pmatrix}Q^{-1}B = \begin{pmatrix} \beta_1^T\\ \vdots \\ \beta_r^T\\ 0\\ \vdots\\ 0 \end{pmatrix} \end{equation*}
的子行向量组,所以矩阵的秩(行秩)大于等于其向量个数,即
\begin{equation*} r(AB) = r\left(\begin{pmatrix} E_r & 0\\ 0 & 0 \end{pmatrix}Q^{-1}B\right)\ge r+s-n, \end{equation*}
结论成立。

练习 4.3.5 练习

基础题.

1.
\(A=\begin{pmatrix} 1 & -3 & -1\\ 0 & 1 & -2\\ -1 & 1 & 5 \end{pmatrix}\),判断下列向量是否属于\(A\)的列空间,并说明理由。
  1. \(\beta=(1,1,0)^T\)
  2. \(\gamma=(1,-1,1)^T\)
2.
\begin{equation*} \alpha_1=\begin{pmatrix} 1\\ 0\\ 2\\ -1 \end{pmatrix},\alpha_2=\begin{pmatrix} -2\\ 1\\ -4\\ 6 \end{pmatrix},\alpha_3=\begin{pmatrix} 3\\ 2\\ 7\\ 5 \end{pmatrix},\alpha_4=\begin{pmatrix} 1\\ -2\\ 6\\ -9 \end{pmatrix}, \end{equation*}
  1. \(\alpha_1,\alpha_2,\alpha_3,\alpha_4\)的一个极大线性无关组;
  2. 将其余向量表示为该极大线性无关组的线性组合。
3.
设向量\(\beta\)可以由\(\alpha_1,\dots ,\alpha_s\)线性表示,但不能由\(\alpha_1,\dots ,\alpha_{s-1}\)线性表示。证明:
  1. 向量组\(\alpha_1,\dots ,\alpha_{s-1},\alpha_s\)与向量组\(\alpha_1,\dots ,\alpha_{s-1},\beta\)等价;
  2. \(r(\alpha_1,\dots ,\alpha_{s-1},\alpha_s)=r(\alpha_1,\dots ,\alpha_{s-1},\beta)\)
4.
设向量组\(\alpha_1,\dots ,\alpha_r\)与向量组\(\beta_1,\dots ,\beta_s\)等价,且\(\alpha_1,\dots ,\alpha_r\)线性无关,试问\(\beta_1,\dots ,\beta_s\)是否一定线性无关?如果结论成立,请证明;如果不成立,请举出反例。
5.
\(A\)是一个对角矩阵,证明:\(r(A)\)等于\(A\)的非0对角元个数。

提高题.

6.
\(\alpha_1,\dots ,\alpha_n\)是一组\(n\)维列向量,已知单位向量\(\varepsilon_1,\dots ,\varepsilon_n\)可被它们线性表示,证明:\(\alpha_1,\dots ,\alpha_n\)线性无关。
7.
\(\alpha_1,\dots ,\alpha_n\)是一组\(n\)维列向量,证明:\(\alpha_1,\dots ,\alpha_n\)线性无关的充要条件是任一\(n\)维列向量都可被它们线性表示。
8.
证明:数域\(\mathbb{F}\)上的\(n\)个方程的\(n\)元线性方程组
\begin{equation*} x_1\alpha_1+\cdots +x_n\alpha_n=\beta \end{equation*}
对任意\(\beta\in\mathbb{F}^n\)都有解的充分必要条件是\(\det (\alpha_1,\dots ,\alpha_n)\neq 0\)
9.
\(\alpha_1,\dots,\alpha_s\)的秩为\(r\),证明:\(\alpha_1,\dots,\alpha_s\)中任意\(r\)个线性无关的向量都构成它的一极大无关组。
10.
\(\alpha_1,\dots,\alpha_s\)的秩为\(r\)\(\alpha_{i_1},\dots,\alpha_{i_r}\)\(\alpha_1,\dots,\alpha_s\)\(r\)个向量,使得\(\alpha_1,\dots,\alpha_s\)中每个向量都可被它们线性表示,证明:\(\alpha_{i_1},\dots,\alpha_{i_r}\)\(\alpha_1,\dots,\alpha_s\)的一个极大无关组。
11.
\(A\)是一个上三角矩阵,证明:\(r(A)\)大于等于\(A\)的非0对角元个数。
12.
\(A\)是秩为\(r\)\(m\times n\)矩阵,从\(A\)中任意取\(s\)行作一个\(s\times n\)矩阵\(B\)。证明:\(r(B)\geq r+s-m\)
13.
证明:\(r\left(\begin{array}{cc} A&0\\0&B \end{array}\right)=r(A)+r(B);\quad r\left(\begin{array}{cc} A&0\\ C &B \end{array}\right) \geq r(A)+r(B)\)
14.
利用 练习 4.3.5.13中的结论证明:设\(A\)\(m\times n\)矩阵,\(B\)\(n\times s\)矩阵,则\(r(AB)\geq r(A)+r(B)-n\)
15.
证明Frobenius不等式:\(r(ABC)\geq r(AB)+r(BC)-r(B)\)
16.
\(A\)\(n\)阶方阵,证明:\(A^2=E_n\)的充要条件是\(r(A+E_n)+r(A-E_n)=n\)