行初等变换和初等矩阵

节 2.4 行初等变换和初等矩阵

通过引入矩阵乘法，线性方程组可以写成\(AX=\beta\)的形式，\(A\)是系数矩阵，\(\beta\)是右端项。本节中，我们将把Gauss消去法中消元的步骤也用矩阵乘法来进行描述。

🔗

子节 2.4.1 Gauss消去法与行初等变换

我们从矩阵的角度重新检视Gauss消去法。把一个线性方程组\(AX=\beta\)的系数矩阵和右端项按行拼在一起，可以获得分块矩阵

\begin{equation*} (A|\beta), \end{equation*}

称这个矩阵为线性方程组的增广矩阵。在不考虑变量名的前提下，线性方程组和其增广矩阵一一对应。

🔗

回顾线性方程组的求解过程，我们只对其系数和常数项进行了运算，化简线性方程组相当于化简其增广矩阵，因此可通过增广矩阵的化简来求解线性方程组。

🔗

例 2.4.1. 矩阵上的Gauss消去法.

通过增广矩阵化简求线性方程组例 2.1.1的解。

🔗

解答.

线性方程组的增广矩阵为

\begin{equation*} (A|\beta)=\left(\begin{array}{cc|c} 1 & 2 & 4\\ 1 & -1 & 1 \end{array}\right), \end{equation*}

对增广矩阵进行化简：

\begin{equation*} \begin{array}{l} \left(\begin{array}{cc|c} 1 & 2 & 4\\ 1 & -1 & 1 \end{array}\right)\xrightarrow{r_1\leftrightarrow r_2}\left(\begin{array}{cc|c} 1 & -1 & 1\\ 1 & 2 & 4 \end{array}\right)\xrightarrow{r_2-r_1}\left(\begin{array}{cc|c} 1 & -1 & 1\\ 0 & 3 & 3 \end{array}\right)\\ \xrightarrow{\frac{1}{3}r_2}\left(\begin{array}{cc|c} 1 & -1 & 1\\ 0 & 1 & 1 \end{array}\right)\xrightarrow{r_1+r_2}\left(\begin{array}{cc|c} 1 & 0 & 2\\ 0 & 1 & 1 \end{array}\right), \end{array} \end{equation*}

以最后一个矩阵为增广矩阵的方程组为

\begin{equation*} \left\{\begin{array}{ccc} x & & =2,\\ & y & =1, \end{array}\right. \end{equation*}

因此原方程组有唯一解 \(\left\{\begin{array}{l} x=2,\\ y=1. \end{array}\right.\)

🔗

结合上例及其它的例子，可知在用Gauss消去法求解线性方程组过程中，我们反复用到了下面三种操作：

交换两个方程的顺序；
🔗

🔗
将一个方程两端同时乘以一个非0常数；
🔗

🔗
将一个方程加上两端同时乘以一个常数的另一个方程。
🔗

🔗

这三种操作都不改变线性方程组的解。

🔗

这三种操作对应到矩阵上，相当于对增广矩阵做了下面三种操作：

行互换变换：交换矩阵的两行；
🔗

🔗
行倍法变换：将矩阵的一行乘以非0常数\(c\)；
🔗

🔗
行消法变换：将矩阵的第\(j\)行加上矩阵的第\(k\)行乘以常数\(c\)。
🔗

🔗

称这三种变换为矩阵的行初等变换，或初等行变换。

🔗

定义 2.4.2.

称对单位矩阵\(E_n\)做一次行初等变换得到的矩阵称为初等矩阵。

🔗

特别地，

称交换单位矩阵\(E_n\)的第\(j\)、\(k\)两行所得的矩阵为互换矩阵，记作\(E(j,k)\)；
🔗

🔗
称将单位矩阵\(E_n\)的第\(j\)行乘以非0常数\(c\)所得的矩阵为倍法矩阵，记作\(E(j(c))\)；
🔗

🔗
称将单位矩阵\(E_n\)的第\(j\)行加上第\(k\)行与常数\(c\)乘积所得的矩阵为消法矩阵，记作\(E(j,k(c))\)。
🔗

🔗

🔗

Sage中可以用下面的命令获得初等矩阵。

🔗

子节 2.4.2 初等矩阵与矩阵乘法

矩阵乘法的一个神奇之处在于：对矩阵做行初等变换可以用“左”乘初等矩阵实现。我们先来看几个具体的例子。

🔗

例 2.4.3. 初等矩阵的乘法.

设\(A=\begin{pmatrix} 2 & 5 & -1\\ 1 & 2 & 3\\ 4 & 7 & 5 \end{pmatrix}\)，计算 \(E(1,3)A,E(2(-1))A,E(1,2(-3))A\)。

🔗

解答.

\begin{equation*} E(1,3)A=\begin{pmatrix} 4 & 7 & 5\\ 1 & 2 & 3\\ 2 & 5 & -1 \end{pmatrix}, \end{equation*}

\begin{equation*} E(2(-1))A=\begin{pmatrix} 2 & 5 & -1\\ -1 & -2 & -3\\ 4 & 7 & 5 \end{pmatrix}, \end{equation*}

\begin{equation*} E(1,2(-3))A=\begin{pmatrix} -1 & -1 & -10\\ 1 & 2 & 3\\ 4 & 7 & 5 \end{pmatrix}. \end{equation*}

🔗

定理 2.4.4.

设\(A\)是任意给定的一个\({n\times m}\)阶矩阵。则对\(A\)做一次行初等变换等价于左乘相应的初等矩阵。

🔗

证明.

以下不妨设\(j< k\)。

将\(E(j,k)\)按行分块，则

\begin{equation*} E(j,k)A=\begin{array}{c} \phantom{\varepsilon_k^T}\\ \\ \mbox{第}j\mbox{行}\\ \phantom{\varepsilon_j^T}\\ \mbox{第}k\mbox{行}\\ \\ \\ \end{array}\left(\begin{array}{c} \varepsilon_1^T\\ \vdots\\ \varepsilon_k^T\\ \vdots\\ \varepsilon_j^T\\ \vdots\\ \varepsilon_n^T \end{array}\right) A=\left(\begin{array}{c} \varepsilon_1^TA\\ \vdots\\ \varepsilon_k^TA\\ \vdots\\ \varepsilon_j^TA\\ \vdots\\ \varepsilon_n^TA \end{array}\right). \end{equation*}

由例 2.3.5知 \(\varepsilon_i^TA\)表示\(A\)的第\(i\)行，因此\(E(j,k)A\)相当于把\(A\)的第\(j\)、\(k\)两行互换，其余行不变。

🔗

🔗
将\(E(j(c))\)按行分块，则

\begin{equation*} E(j(c))A=\begin{pmatrix} \varepsilon_1^T\\ \vdots\\ \varepsilon_{j-1}^T\\ c\varepsilon_j^T\\ \varepsilon_{j+1}^T\\ \vdots\\ \varepsilon_n^T \end{pmatrix}A=\begin{pmatrix} \varepsilon_1^TA\\ \vdots\\ \varepsilon_{j-1}^TA\\ c\varepsilon_j^TA\\ \varepsilon_{j+1}^TA\\ \vdots\\ \varepsilon_n^TA \end{pmatrix} \end{equation*}

相当于用\(c\)乘\(A\)的第\(j\)行，其余行不变。

🔗

🔗
将\(E(j,k(c))\)按行分块，则

\begin{equation*} E(j,k(c))A=\begin{array}{c} \phantom{\varepsilon_j^T}\\ \\ \mbox{第}j\mbox{行}\\ \phantom{\varepsilon_j^T}\\ \mbox{第}k\mbox{行}\\ \\ \\ \end{array}\left(\begin{array}{c} \varepsilon_1^T\\ \vdots\\ \varepsilon_j+c\varepsilon_k^T\\ \vdots\\ \varepsilon_k^T\\ \vdots\\ \varepsilon_n^T \end{array}\right) A=\left(\begin{array}{c} \varepsilon_1^TA\\ \vdots\\ \varepsilon_jA+c\left(\varepsilon_k^TA\right)\\ \vdots\\ \varepsilon_k^TA\\ \vdots\\ \varepsilon_n^TA \end{array}\right) \end{equation*}

相当于把\(A\)的第\(k\)行的\(c\)倍加到第\(j\)行，其余行不变。

🔗

🔗

🔗

借助下面的sage程序片段，可以验证上述结论。

🔗

直接用矩阵乘法计算公式计算初等矩阵与其它矩阵的乘积是不划算的，当计算初等矩阵与其它矩阵相乘时，我们通常直接使用初等变换来帮助计算。

🔗

例 2.4.5.

求\(E(1,3)^{2025}A\)，其中

\begin{equation*} A = \begin{pmatrix} 1 & 2 & 3 & 4 \\ 5 & 6 & 7 & 8 \\ -1 & 0 & 1 & 2 \end{pmatrix} \end{equation*}

🔗

解答.

\(E(1,3)^{2025}A\)相当于把\(A\)的第\(1\)、\(3\)两行互换\(2025\)次，因此

\begin{equation*} E(1,3)^{2025}A=\begin{pmatrix} -1 & 0 & 1 & 2\\ 5 & 6 & 7 & 8 \\ 1 & 2 & 3 & 4 \end{pmatrix}. \end{equation*}

🔗

子节 2.4.3 用行初等变换/矩阵化简矩阵

Gauss消去法本质上可以等同与先用行初等变换化简增广矩阵，然后对化简所得方程组进行求解。下面我们来讨论矩阵用行初等变换化简之后的可能结果。

🔗

我们先来定义一种有典型结构特点的矩阵。

🔗

定义 2.4.6.

设\(A\)是一个矩阵。对\(A\)的每一个元素不全为0的行，称该行从左起第一个非0元为一个主元。

🔗

若矩阵\(A\)满足条件：

对于每一个元素不全为0的行，主元的列指标随行指标的增大严格增加；
🔗

🔗
元素全为0的行下方（若存在）必定都是0，即全0行集中在矩阵的底部；
🔗

🔗

则称矩阵\(A\)为阶梯形矩阵，或称为行阶梯形矩阵。

🔗

举例来说，下面两个矩阵中的第1个矩阵是阶梯形矩阵，其主元是\(1,2,-1\)；第2个矩阵不是阶梯形矩阵，因为第3行主元的列指标是2，与第2行主元的列指标相同，没有严格增加。

\begin{equation*} \begin{pmatrix} 1 & 2 & 1 & 2\\ 0 & 2 & -3 & 0\\ 0 & 0 & 0 &-1\\ 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 \end{pmatrix}\quad\quad \begin{pmatrix} 1 & 2 & 1 & 2\\ 0 & 2 & -3 & 0\\ 0 & 1 & 0 &-1\\ 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 \end{pmatrix} \end{equation*}

🔗

若我们在阶梯形矩阵的每个主元左侧画一条竖线，然后用水平线段将这这些竖线依次连接起来，可以构成一条阶梯形折线，在这条折线下方矩阵的元素都为0，这是阶梯形矩阵的直观特征，如下图所示。

🔗

按照定义，0矩阵也是特殊的阶梯形矩阵。此时矩阵中没有不全为0的行，定义 2.4.6中的条件1自动满足。

🔗

以阶梯形矩阵为增广矩阵的线性方程组解是好求的。

🔗

例 2.4.8.

求解线性方程组\(\left\{\begin{array}{rl} x_1 +2x_2 +x_3 +2x_4 &=1,\\ 2x_2 -3x_3 +x_4 &=2,\\ x_3 +x_4 &=0. \end{array}\right.\)

🔗

解答.

从最后一个方程可知

\begin{equation} x_3=-x_4.\tag{2.4.1} \end{equation}

将其代入第二个方程可得\(2x_2-3(-x_4)+x_4=2\)，即\(2x_2+4x_4=2\)，从而

\begin{equation} x_2=-2x_4+1.\tag{2.4.2} \end{equation}

将\(x_2,x_3\)的表达式代入第一个方程可得

\begin{equation*} x_1+2(-2x_4+1)+(-x_4)+2x_4=1, \end{equation*}

即\(x_1-3x_4+2=1\)，从而

\begin{equation} x_1=3x_4-1.\tag{2.4.3} \end{equation}

因此方程组的解满足：

\begin{equation*} \left\{\begin{array}{l} x_1=3x_4-1,\\ x_2=-2x_4+1,\\ x_3=-x_4, \end{array}\right. \end{equation*}

其中\(x_4\)可取任意常数。

🔗

下面说明任意一个矩阵都可以经过一系列行初等变换变成阶梯形矩阵，这个过程相当于Gauss消去法的矩阵描述。

🔗

定理 2.4.9.

设\(A\)是任意一个给定的矩阵，则存在初等矩阵\(P_1,\dots,P_k\)，使得\(P_k\cdots P_1A\)是阶梯形矩阵。

🔗

证明.

首先找到矩阵\(A\)的第一个不全为0的列。若\(A\)所有列都是0，则\(A\)已经是阶梯形矩阵。此时取\(k=0\)即可。

🔗

下面假设\(A\)不是0矩阵，记\(j_1\)为第一个非0列的列指标，同时记第\(j_1\)列的第一个非0元在第\(i_1\)行。经过最多一次行初等变换，我们可以把这个非0元\(a_{i_1j_1}\)交换到第一行\(a_{1j_1}\)的位置上。为了记号简单，不妨假设\(i_1=1\)。

🔗

现在我们可以对所得矩阵的第\(j_1\)列进行消元。对第\(j_1\)列中除\(a_{1j_1}\)外的每个非0元\(a_{ij_1}\)（\(i\neq 1\)）所在的行施行一次行消法变换，即左乘\(E\left(i,1(c_i)\right)\)，其中\(c_i=-a_{ij_1}/a_{1j_1}\)，使得第\(j_1\)列除\(a_{1j_1}\)外的所有元素都变为0。此时矩阵形如：

\begin{equation} \begin{pmatrix} 0 & \cdots & 0 & a_{1j_1} & * & \cdots & *\\ 0 & \cdots & 0 & 0 & * & \cdots & *\\ \vdots & \vdots & \vdots & \vdots & \vdots & \ddots& \vdots\\ 0 & \cdots & 0 & 0 & * & \cdots & * \end{pmatrix}.\tag{2.4.4} \end{equation}

🔗

若变成的矩阵(2.4.4)已经是一个阶梯形矩阵，则将上述行初等变换的初等矩阵按实施次序记录为\(P_1,\dots,P_k\)，则\(P_k\cdots P_1A\)就是所求的阶梯形矩阵。

🔗

若(2.4.4)还不是阶梯形矩阵，则把(2.4.4)中的第2行到最后一行构成的矩阵记为\(A_1\)，对\(A_1\)重复上述过程（对\(A_1\)做行初等变换也相当于对(2.4.4)做行初等变换）。\(A_1\)的行数比\(A\)的行数严格少1，因此重复有限步后这个过程必然终止，过程终止时获得的矩阵就是一个阶梯形矩阵。按照上述过程中的实施顺序记录初等矩阵\(P_1,\dots,P_k\)，则\(P_k\cdots P_1A\)就是所求的阶梯形矩阵。

🔗

上述证明是一个算法式证明，有兴趣的同学可以实现一下相关代码。下面来看一个具体的算例。

🔗

例 2.4.10. 手动化简计算阶梯形矩阵.

用行初等变换将矩阵\(A=\begin{pmatrix} 3 & -2 & -7 & 4\\ 1 & 2 & -3 & 1\\ 2 & 8 & -7 & 3 \end{pmatrix}\)化为阶梯形矩阵。

🔗

提示.

\(\) 手动计算过程中，可以通过选择合适的主元来简化计算。

🔗

解答.

对\(A\)施行如下行初等变换：

\begin{equation*} \begin{array}{l} A\xrightarrow{r_1\leftrightarrow r_2}\begin{pmatrix} 1 & 2 & -3 & 1\\ 3 & -2 & -7 & 4\\ 2 & 8 & -7 & 3 \end{pmatrix}\xrightarrow{r_2-3r_1}\begin{pmatrix} 1 & 2 & -3 & 1\\ 0 & -8 & 2 & 1\\ 2 & 8 & -7 & 3 \end{pmatrix}\\ \xrightarrow{r_3-2r_1}\begin{pmatrix} 1 & 2 & -3 & 1\\ 0 & -8 & 2 & 1\\ 0 & 4 & -1 & 1 \end{pmatrix}\xrightarrow{r_2\leftrightarrow r_3}\begin{pmatrix} 1 & 2 & -3 & 1\\ 0 & 4 & -1 & 1\\ 0 & -8 & 2 & 1 \end{pmatrix}\\ \xrightarrow{r_3+2r_2}\begin{pmatrix} 1 & 2 & -3 & 1\\ 0 & 4 & -1 & 1\\ 0 & 0 & 0 & 3 \end{pmatrix}. \end{array} \end{equation*}

🔗

一个矩阵变成阶梯形矩阵的过程并不唯一，结果也不唯一。请同学们思考：这一变化过程中，什么是不变的？这个问题我们在节 2.6中将进一步探讨。

🔗

练习 2.4.4 练习

基础题.

🔗

1.

设\(A=\begin{pmatrix} 1 & 2 & 3 & 4\\ -1 & -2 & -3 & -4\\ 1 & 2 & 3 & 4 \end{pmatrix}\)，计算：

\(\displaystyle \begin{pmatrix} 0 & 1 & 0\\ 1 & 0 & 0\\ 0 & 0 & 1 \end{pmatrix}^{2025}A;\)
🔗

🔗
\(\displaystyle \begin{pmatrix} 1 & 0 & 0\\ 0 & -1 & 0\\ 0 & 0 & 1 \end{pmatrix}^{2025}A;\)
🔗

🔗
\(\begin{pmatrix} 1 & 0 & 0\\ 2 & 1 & 0\\ 0 & 0 & 1 \end{pmatrix}A\)。
🔗

🔗

🔗

2.

判断下列矩阵是否为阶梯形矩阵。

\(\displaystyle \begin{pmatrix} 1 & -1 & 2\\ 0 & 0 & 3\\ 0 & 1 & 2 \end{pmatrix};\)
🔗

🔗
\(\displaystyle \begin{pmatrix} 0 & 2 & 4 & 0 & 5\\ 0 & 0 & 0 & 1 & -1 \end{pmatrix};\)
🔗

🔗
\(\displaystyle \begin{pmatrix} 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 \end{pmatrix};\)
🔗

🔗
\(\displaystyle \begin{pmatrix} 0 & 0 & 1\\ 0 & 1 & 0\\ 1 & 0 & 0 \end{pmatrix};\)
🔗

🔗
\(\displaystyle \begin{pmatrix} 1 & -1 & 2\\ 0 & 1 & 3\\ 0 & 1 & 2\\ 0 & 0 & -4 \end{pmatrix};\)
🔗

🔗
\(\begin{pmatrix} 1 & 3 & 9 & 0\\ 0 & 0 & 0 & 0\\ 0 & 0 & 1 & 0 \end{pmatrix}\)。
🔗

🔗

🔗

3.

用初等行变换将矩阵\(A\)化为阶梯形矩阵。

\(\displaystyle A=\begin{pmatrix} 0 & 0 & 1 & 3\\ 0 & 1 & 0 & 2\\ 1 & 0 & 0 & 1 \end{pmatrix};\)
🔗

🔗
\(\displaystyle A=\begin{pmatrix} 1 & 2 & 3 & 4\\ 5 & 6 & 7 & 8\\ 9 & 10 & 11 & 12 \end{pmatrix};\)
🔗

🔗
\(A=\begin{pmatrix} 2 & 0 & -1 & 3\\ 1 & 2 & -2 & 4\\ 0 & 1 & 3 & -1 \end{pmatrix}\)。
🔗

🔗

🔗

提高题.

🔗

4.

上题所化的阶梯形矩阵能否通过初等行变换化为原矩阵\(A\)？若能，写出所施行的初等行变换。

🔗

5.

证明：\(E(i,j)=E\left(j(-1)\right)E\left(i,j(1)\right)E\left(j,i(-1)\right)E\left(i,j(1)\right)\)。

🔗

6.

请指出以下证明“任一\(m\times n\)矩阵\(A\)（ \(m\geq 2\)）必可经过初等行变换化为至少一行全为0的矩阵”中的错误。

🔗

“先将\(A\)的第1行加到第2行，第2行加到第1行得矩阵

\begin{equation*} B=\begin{pmatrix} a_{11}+a_{21} & a_{12}+a_{22} & \cdots & a_{1n}+a_{2n}\\ a_{11}+a_{21} & a_{12}+a_{22} & \cdots & a_{1n}+a_{2n}\\ a_{31} & a_{32} & \cdots & a_{3n}\\ \vdots & \vdots & & \vdots\\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}, \end{equation*}

再将\(B\)的第1行乘以\(-1\)加到第2行可得第2行全为0的矩阵

\begin{equation*} C=\begin{pmatrix} a_{11}+a_{21} & a_{12}+a_{22} & \cdots & a_{1n}+a_{2n}\\ 0 & 0 & \cdots & 0\\ a_{31} & a_{32} & \cdots & a_{3n}\\ \vdots & \vdots & & \vdots\\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}.\mbox{”} \end{equation*}

🔗

挑战题.

🔗

7.

设\(A=\begin{pmatrix} a & 0\\ 0 & a^{-1} \end{pmatrix}\)，其中\(a\neq 0\)。证明：\(A\)可表示成若干消法矩阵的乘积。

🔗

8.

设\(A\)是\(n\)阶方阵，证明：\(A\)是置换矩阵的充分必要条件为\(A\)可表示成若干互换矩阵的乘积。

🔗

向前 Top 向后