主要内容

高等代数: 多项式与线性代数

2.5 可逆矩阵

对线性方程组的增广矩阵作初等行变换后,所对应的线性方程组与原方程组同解,这个事实该如何从矩阵的角度进行理解?本节中,我们将给出这个问题的一个答案。

子节 2.5.1 初等行变换的可逆性

初等行变换是一个同解变形,一部分原因是由于初等行变换是一个“可逆”的变换。初等行变换的“可逆”性可以用下面的命题来进行具体表述。

证明.

只需证明若\(A\)经过一次初等行变换可以变成矩阵\(B\),则矩阵\(B\)也可以经过一次初等行变换变成矩阵\(A\)
  • 互换变换情形:若交换矩阵\(A\)\(j,k\)两行得到\(B\),那么交换\(B\)的第\(j,k\)两行可以得到\(A\)
  • 倍法变换情形:若将矩阵\(A\)\(j\)行乘以非零常数\(c\)得到\(B\),则将矩阵\(B\)\(j\)行乘以\(\frac{1}{c}\)可以得到\(A\)
  • 消法变换情形:若将矩阵\(A\)\(j\)行加上第\(k\)行的\(c\)倍得到\(B\),则将矩阵\(B\)\(j\)行加上第\(k\)行的\(-c\)倍可以得到\(A\)
上述证明中的一个关键点在于
\begin{equation*} E(i,j)E(i,j)=E_n, \end{equation*}
\begin{equation*} E(i(c^{-1}))E(i(c)) = E_n, \end{equation*}
\begin{equation*} E(i,j(-c))E(i,j(c)) = E_n. \end{equation*}
同时,容易验证
\begin{equation*} E(i(c))E(i(c^{-1})) = E_n, \end{equation*}
\begin{equation*} E(i,j(c))E(i,j(-c)) = E_n. \end{equation*}
把上述性质一般化,可以给出如下定义。

定义 2.5.2.

\(A\)\(n\)阶方阵。若存在矩阵\(B\),使得
\begin{equation*} AB=E_n, \quad BA = E_n, \end{equation*}
则称\(A\)可逆(或非奇异非异),\(B\)称为\(A\)逆矩阵。若\(B\)不存在,则称\(A\)不可逆(或奇异)。

2.5.3.

\(A=\begin{pmatrix} 3 & -2\\ 2 & -1 \end{pmatrix}\)\(B=\begin{pmatrix} -1 & 2\\ -2 & 3 \end{pmatrix}\)。由于
\begin{equation*} AB=\begin{pmatrix} 3 & -2\\ 2 & -1 \end{pmatrix}\begin{pmatrix} -1 & 2\\ -2 & 3 \end{pmatrix}=\begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix} \end{equation*}
\begin{equation*} BA=\begin{pmatrix} -1 & 2\\ -2 & 3 \end{pmatrix}\begin{pmatrix} 3 & -2\\ 2 & -1 \end{pmatrix}=\begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix}, \end{equation*}
因此\(A\)可逆,且\(B=\begin{pmatrix} -1 & 2\\ -2 & 3 \end{pmatrix}\)\(A\)的一个逆矩阵。
上述定义中,我们使用了两个等式\(AB=E_n\)\(BA=E_n\)来共同要求可逆矩阵及其逆需要满足的性质,后续我们会证明只要\(AB=E_n\)(或\(BA=E\))就可保证\(A\)可逆,且\(B\)\(A\)的逆。
根据上述定义,只有方阵才有可逆性的定义(请思考原因)。对于非方矩阵,它们的可逆性及逆矩阵在我们的书里是没有定义的。
0方阵显然没有逆矩阵。对于一般的方阵,即便不是0方阵,其逆矩阵也不一定存在。举例来说,矩阵
\begin{equation*} A= \begin{pmatrix} 1 & 0\\0 & 0 \end{pmatrix} \end{equation*}
就没有逆矩阵,也就是说\(A\)不可逆。因为对任意的\(B=(b_{ij})_{2\times 2}\)
\begin{equation*} AB= \begin{pmatrix} 1 & 0\\0 & 0 \end{pmatrix} \begin{pmatrix} b_{11} & b_{12}\\b_{21} & b_{22} \end{pmatrix} =\begin{pmatrix} b_{11} & b_{12}\\0 & 0 \end{pmatrix}, \end{equation*}
不可能等于单位矩阵,即满足条件的\(B\)不存在。
上述例子提示我们,由矩阵乘法定义,当左乘的矩阵\(A\)有一个全0行时,无论右乘矩阵\(B\)是什么,乘积矩阵\(AB\)都会有一个全0行,不可能等于单位矩阵\(E\),即\(A\)一定不可逆。这个事实将是后面我们说明一个矩阵不可逆时用到的主要工具。
为了进一步讨论如何判断矩阵是否可逆的问题前,我们先来讨论一下逆的性质。首先讨论的是唯一性问题,即当假定\(A\)可逆时,满足可逆性定义中条件的\(B\)矩阵,也就是\(A\)的逆矩阵,是否唯一?我们有下面的结论。

证明.

\(n\)阶方阵\(A\)可逆。若\(B\)\(C\)都是\(A\)的逆矩阵,即
\begin{equation*} AB=BA=E_n, AC=CA=E_n, \end{equation*}
\begin{equation*} B=BE_n=B(AC)=(BA)C=E_nC=C. \end{equation*}
对于一个可逆矩阵\(A\),我们用\(A^{-1}\)表示\(A\)的唯一逆矩阵,读做\(A\)逆。

2.5.5. 按定义求逆.

判断下面的矩阵是否可逆;若可逆,求出其逆矩阵。
  1. \(\begin{pmatrix} 1 & 2\\ 3 & 6 \end{pmatrix}\)
  2. \(\begin{pmatrix} 1 & 2\\ 3 & 4 \end{pmatrix}\)
解答.
  1. \(A=\begin{pmatrix} 1 & 2\\ 3 & 6 \end{pmatrix}\)可逆,设\(B=\begin{pmatrix} b_{11} & b_{12}\\ b_{21} & b_{22} \end{pmatrix}\)\(A\)的逆矩阵,则\(AB=E_2\),即
    \begin{equation*} \begin{pmatrix} 1 & 2\\ 3 & 6 \end{pmatrix}\begin{pmatrix} b_{11} & b_{12}\\ b_{21} & b_{22} \end{pmatrix}=\begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix}, \end{equation*}
    可得
    \begin{equation} b_{11}+2b_{21}=1, \tag{2.5.1} \end{equation}
    \begin{equation} b_{12}+2b_{22}=0, \tag{2.5.2} \end{equation}
    \begin{equation} 3b_{11}+6b_{21}=0, \tag{2.5.3} \end{equation}
    \begin{equation} 3b_{12}+6b_{21}=1. \tag{2.5.4} \end{equation}
    将方程(2.5.1)乘以\(-3\)加到方程(2.5.3)
    \begin{equation*} 0=-3, \end{equation*}
    矛盾。因此\(A=\begin{pmatrix} 1 & 2\\ 3 & 6 \end{pmatrix}\)不可逆。
  2. \(A=\begin{pmatrix} 1 & 2\\ 3 & 4 \end{pmatrix}\)。假设存在\(B=\begin{pmatrix} b_{11} & b_{12}\\ b_{21} & b_{22} \end{pmatrix}\),使得
    \begin{equation*} AB=E_2,BA=E_2. \end{equation*}
    \(AB=E_2\)
    \begin{equation*} \begin{pmatrix} 1 & 2\\ 3 & 4 \end{pmatrix}\begin{pmatrix} b_{11} & b_{12}\\ b_{21} & b_{22} \end{pmatrix}=\begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix}, \end{equation*}
    \begin{equation*} \left\{\begin{array}{cl} b_{11}+2b_{21}&=1,\\ b_{12}+2b_{22}&=0,\\ 3b_{11}+4b_{21}&=0,\\ 3b_{12}+4b_{22}&=1,\\ \end{array}\right. \end{equation*}
    解得 \(b_{11}=-2,b_{12}=1,b_{21}=\frac{3}{2},b_{22}=-\frac{1}{2}\)。不难验证
    \begin{equation*} \begin{pmatrix} -2 & 1\\ \frac{3}{2} & -\frac{1}{2} \end{pmatrix}\begin{pmatrix} 1 & 2\\ 3 & 4 \end{pmatrix}=\begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix} \end{equation*}
    也成立,因此\(A\)可逆且\(A^{-1}=\begin{pmatrix} -2 & 1\\ \frac{3}{2} & -\frac{1}{2} \end{pmatrix}\)
下面是一个有一般性的例子,这个例子与后续章节行列式的内容有关。

证明.

因为
\begin{equation*} \begin{pmatrix} a & b\\ c & d \end{pmatrix}\begin{pmatrix} d & -b\\ -c & a \end{pmatrix}=\begin{pmatrix} ad-bc & -ab+ba\\ cd-dc & -cb+da \end{pmatrix}=\begin{pmatrix} ad-bc & 0\\ 0 & ad-bc \end{pmatrix}, \end{equation*}
\begin{equation*} \begin{pmatrix} d & -b\\ -c & a \end{pmatrix}\begin{pmatrix} a & b\\ c & d \end{pmatrix}=\begin{pmatrix} da-bc & db-bd\\ -ca+ac & -cb+ad \end{pmatrix}=\begin{pmatrix} ad-bc & 0\\ 0 & ad-bc \end{pmatrix}, \end{equation*}
所以当\(ac-bd\ne 0\)时,
\begin{equation*} A\left(\frac{1}{ac-bd}\begin{pmatrix} d & -b\\ -c & a \end{pmatrix}\right)=E_n, \end{equation*}
\begin{equation*} \left(\frac{1}{ac-bd}\begin{pmatrix} d & -b\\ -c & a \end{pmatrix}\right)A=E_n, \end{equation*}
由此推出\(A\)可逆,且\(A^{-1} =\frac{1}{ac-bd}\begin{pmatrix} d & -b\\ -c & a \end{pmatrix}\)
根据命题 2.5.1后的说明,可知下面的结论成立。
以可逆矩阵为系数矩阵的线性方程组有很好的性质。

证明.

存在性:因为
\begin{equation*} A(A^{-1}\beta)=(AA^{-1})\beta=E_n\beta=\beta, \end{equation*}
所以\(x=A^{-1} \beta\)是线性方程组\(Ax= \beta\)的一个解。
唯一性:若\(\alpha_1,\alpha_2\)都是\(Ax=\beta\)的解,即
\begin{equation*} A\alpha_1=\beta, A\alpha_2=\beta, \end{equation*}
\begin{equation*} A\alpha_1=A\alpha_2. \end{equation*}
由于\(A\)可逆,所以
\begin{equation*} A^{-1}(A\alpha_1)=A^{-1}(A\alpha_2), \end{equation*}
由此推出\(\alpha_1=\alpha_2\)

子节 2.5.2 可逆矩阵的基本性质

下面列出矩阵求逆的一些常用运算性质,这些性质按照定义都很好验证,相应的验证工作留给读者。
  1. \(A\)可逆,则\(A\)的逆矩阵\(A^{-1}\)也可逆,且
    \begin{equation*} (A^{-1})^{-1} = A, \end{equation*}
    \(A\)\(A^{-1}\)互为逆矩阵。
  2. \(A\)可逆,\(c\)是一个非0常数,则\(cA\)可逆,且
    \begin{equation*} (cA)^{-1} =\frac{1}{c} A^{-1}. \end{equation*}
  3. 若矩阵\(A\)\(B\)均可逆,则\(AB\)可逆,且
    \begin{equation*} {\color{red}(AB)^{-1} = B^{-1}A^{-1}}. \end{equation*}
  4. \(A\)可逆,则\(A\)的转置矩阵\(A^T\)也可逆,且
    \begin{equation*} (A^T)^{-1} =(A^{-1})^T. \end{equation*}
  5. 若复方阵\(A\)可逆,则\(\bar{A}\)也可逆,且
    \begin{equation*} (\bar{A})^{-1} =\overline{A^{-1}}. \end{equation*}
  6. 可逆矩阵参与的矩阵乘法可以有消去律成立:若\(A\)可逆,且\(AB=AC\),则在等式两端同时左乘\(A^{-1}\),就可以推知\(B=C\),也就是左消去律成立;同理可知右消去律也成立,即在\(A\)可逆的前提下,\(B A=CA\)可以推出\(B=C\)成立。
上述性质中第3条性质是最重要的性质,需要特别注意,同时这也是初学者容易出错的一条性质。请尝试给出具体的反例说明存在矩阵\(A\)\(B\)均可逆但
\begin{equation*} {(AB)^{-1} \ne A^{-1} B^{-1}}. \end{equation*}
利用数学归纳法,容易证明第3条性质可以推广到多个矩阵相乘:设\(A_1,\dots,A_k\)均是可逆的同阶方阵,则\(A_1\cdots A_k\)可逆,且
\begin{equation*} (A_1\cdots A_k)^{-1} = A_k^{-1}\cdots A_1^{-1}. \end{equation*}
特别地,若\(A_1=\cdots =A_k=A\)可逆,则上式可以用来定义可逆矩阵的负指数幂。

定义 2.5.9.

\(A\)是一个可逆方阵,\(k\in \Z^+\)是一个正整数,则\(A^{-k}\)定义为:
\begin{equation*} A^{-k}=(A^k)^{-1}=(A^{-1})^k. \end{equation*}
有了这个定义后,幂函数的性质\(A^rA^s=A^{r+s}\)\((A^r)^s = A^{rs}\)对任意整数\(r,s\)都成立,当然,这要有一个前提,即\(A\)可逆。特别地,在\(A\)可逆的前提下,约定\(A^0 = E\)

子节 2.5.3 可逆矩阵与初等矩阵

给了一个方阵\(A\),如何判断\(A\)是否可逆?若\(A\)可逆,如何计算\(A\)的逆矩阵?我们接下来解决这两个问题。为解决上述问题,需要下面几个引理。
上述引理也可表述为左乘可逆矩阵不改变矩阵的可逆性。(事实上,右乘可逆矩阵也不改变矩阵的可逆性。)
下面我们给出可逆矩阵的第一个刻画性定理。

证明.

"1. \(\Rightarrow\) 2." 根据定理 2.4.9,存在初等矩阵\(P_1,\ldots ,P_k\),使得\(P_k\cdots P_1A\)是阶梯型矩阵。因为\(A,P_1,\ldots ,P_k\)都是可逆矩阵,所以乘积矩阵\(P_k\cdots P_1A\)也可逆。注意到可逆矩阵没有全0行,因此阶梯型可逆矩阵\(P_k\cdots P_1A\)必形如
\begin{equation*} B=\begin{pmatrix} b_{11}&b_{12}&\cdots&b_{1n}\\ 0&b_{22}&\cdots&b_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&b_{nn} \end{pmatrix}, \end{equation*}
其中对角元\(b_{11},\ldots ,b_{nn}\)都非0。将\(B\)的第\(i\)行乘以\(\frac{1}{b_{ii}}(1\leq i\leq n)\),得
\begin{equation*} C=\begin{pmatrix} 1&c_{12}&\cdots&c_{1n}\\ 0&1&\cdots&c_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&1 \end{pmatrix}, \end{equation*}
\(C\)最后一行的适当倍数加到它上面的每一行,可以使最后一列除对角元外其余元素都变成0;接着对倒数第二行进行类似初等行变换,可以使倒数第二列除对角元外其余元素都变成0;依此类推,自下而上依次进行初等行变换,可将矩阵\(C\)化为单位矩阵。故存在初等矩阵 \(P_1,\ldots ,P_s\),使得
\begin{equation*} P_s\cdots P_1A=E_n. \end{equation*}
从而 \(A=P_1^{-1}\cdots P_s^{-1}\)可以表示为初等矩阵的乘积。
"2. \(\Rightarrow\) 3."设\(A=P_1\cdots P_k\),其中\(P_1,\ldots ,P_k\)是初等矩阵,则
\begin{equation} P_k^{-1}\cdots P_1^{-1}A=E_n.\tag{2.5.5} \end{equation}
由于初等矩阵\(P_i\)的逆矩阵\(P_i^{-1}\)仍是初等矩阵,所以由(2.5.5)\(A\)可以经过初等行变换变成单位矩阵。
"3. \(\Rightarrow\) 1." 根据已知条件,存在初等矩阵\(P_1,\ldots ,P_k\),使得
\begin{equation*} P_k\cdots P_1A=E_n, \end{equation*}
\(A=P_1^{-1}\cdots P_k^{-1}\)。注意到可逆矩阵\(P_1^{-1},\ldots ,P_k^{-1}\)的乘积仍可逆,因此\(A\)可逆且
\begin{equation*} A^{-1}=\left(P_1^{-1}\cdots P_k^{-1}\right)^{-1}=P_k\cdots P_1. \end{equation*}
上述定理的证明过程中暗含了逆矩阵的计算方法:设\(A\)是一个可逆矩阵,则\(A\)可以经过初等行变换变成单位矩阵。记\(P_1,\dots,P_k\)是把\(A\)变成单位矩阵过程中按顺序使用的所有初等行变换对应的初等矩阵,则
\begin{equation*} P_k\cdots P_1 A = E, \end{equation*}
于是
\begin{equation*} A^{-1} =P_k\cdots P_1, \end{equation*}
所以只要我们能记录下将\(A\)变成单位矩阵过程中,所使用的初等矩阵的乘积即可。
我们可以用下面方法记录所使用的初等矩阵的乘积:构造分块矩阵
\begin{equation*} (A|E), \end{equation*}
对此分块矩阵作初等行变换,即按顺序左乘\(P_1,\dots,P_k\),根据分块矩阵乘法公式可得
\begin{align*} P_k\cdots P_1 (A|E) \amp = (P_k\cdots P_1A|P_k\cdots P_1E) \\ \amp= (E|P_k\cdots P_1) \\ \amp = (E| A^{-1}). \end{align*}
也就是说当我们对分块矩阵\((A|E)\)作初等行变换,把左边一块变成单位矩阵时,右边一块剩下的就是\(A^{-1}\)。来看一个具体的例子。

2.5.13.

\(A=\begin{pmatrix} 2 & 2 & 3\\ 1 & -1 & 0\\ -1 & 2 & 1 \end{pmatrix}\),求\(A^{-1}\)
解答.
对分块矩阵\((A|E)\)作初等行变换
\begin{equation*} \begin{array}{rl} (A|E) = & \left(\begin{array}{ccc|ccc} 2 & 2 & 3 & 1 & 0 & 0\\ 1 & -1 & 0 & 0 & 1 & 0\\ -1 & 2 & 1 & 0 & 0 & 1 \end{array}\right)\\ \xrightarrow{r_1\leftrightarrow r_2}&\left(\begin{array}{ccc|ccc} 1 & -1 & 0 & 0 & 1 & 0\\ 2 & 2 & 3 & 1 & 0 & 0\\ -1 & 2 & 1 & 0 & 0 & 1 \end{array}\right)\\ \xrightarrow{\begin{array}{c}r_2-2r_1\\r_3+r_2\end{array}}&\left(\begin{array}{ccc|ccc} 1 & -1 & 0 & 0 & 1 & 0\\ 0 & 4 & 3 & 1 & -2 & 0\\ 0 & 1 & 1 & 0 & 1 & 1 \end{array}\right)\\ \xrightarrow{r_2\leftrightarrow r_3}&\left(\begin{array}{ccc|ccc} 1 & -1 & 0 & 0 & 1 & 0\\ 0 & 1 & 1 & 0 & 1 & 1\\ 0 & 4 & 3 & 1 & -2 & 0 \end{array}\right)\\ \xrightarrow{r_3-4r_2}&\left(\begin{array}{ccc|ccc} 1 & -1 & 0 & 0 & 1 & 0\\ 0 & 1 & 1 & 0 & 1 & 1\\ 0 & 0 & -1 & 1 & -6 & -4 \end{array}\right)\\ \xrightarrow{-r_3}&\left(\begin{array}{ccc|ccc} 1 & -1 & 0 & 0 & 1 & 0\\ 0 & 1 & 1 & 0 & 1 & 1\\ 0 & 0 & 1 & -1 & 6 & 4 \end{array}\right)\\ \xrightarrow{r_2-r_3}&\left(\begin{array}{ccc|ccc} 1 & -1 & 0 & 0 & 1 & 0\\ 0 & 1 & 0 & 1 & -5 & -3\\ 0 & 0 & 1 & -1 & 6 & 4 \end{array}\right)\\ \xrightarrow{r_1+r_2}&\left(\begin{array}{ccc|ccc} 1 & 0 & 0 & 1 & -4 & -3\\ 0 & 1 & 0 & 1 & -5 & -3\\ 0 & 0 & 1 & -1 & 6 & 4 \end{array}\right), \end{array} \end{equation*}
所以\(A^{-1}=\begin{pmatrix} 1 & -4 & -3\\ 1 & -5 & -3\\ -1 & 6 & 4 \end{pmatrix}\)

子节 2.5.4 可逆与行等价

对于两个同阶矩阵\(A\)\(B\)(不一定是方阵),若从\(A\)经过(多次)初等行变换可以变成矩阵\(B\),则称\(A\)\(B\)行等价的。定理 2.4.9也可叙述为:任意给定的矩阵\(A\)都行等价于某一个阶梯型矩阵。
下面用可逆矩阵来进一步研究行等价这种同阶矩阵间的关系。根据定理 2.5.12,可知下面的结论成立。
下面的结论说明了“行等价”名称中“等价”的合理性。
借助行等价,我们给出矩阵可逆的另外一些等价条件。
本节最后,我们说明可逆定义中两个条件\(AB=E_n\)\(BA=E_n\)只需要一个就可以保证矩阵的可逆性。

证明.

若存在矩阵\(B\),使得\(BA=E_n\)。考虑\(Ax=0\)的任一解,由\(Ax=0\)的解满足\(BAx=0\)可得
\begin{equation*} E_nx=0, \end{equation*}
\(x=0\),即\(Ax=0\)只有0解。根据定理 2.5.16\(A\)可逆。将\(BA=E_n\)两边同时右乘\(A^{-1}\)\(B=A^{-1}\)
若存在矩阵\(B\),使得\(AB=E_n\),则\(B^TA^T=E_n\)。由上面的证明可知,\(A^T\)可逆且\(\left(A^T\right)^{-1}=B^T\),由此推出\(A\)可逆且\(A^{-1}=B\)

子节 2.5.5 矩阵的LU分解和线性方程组求解*

矩阵分解通常是指将一个矩阵\(A\)写成多个简单矩阵相乘或相加的过程,有时也可以指其分解后的表达式。
下面我们介绍一个在求解线性方程组过程中常用的一种矩阵分解,称为LU分解,其中L代表下三角矩阵(Lower triangler matrix),U代表上三角矩阵(Upper triangler matrix)。

练习 2.5.6 练习

提高题.

1.
\(A,B\)是数域\(\F\)\(n\)阶方阵,\(f(x),g(x)\in\F[x]\)满足\(f(A)=0,g(B)=0\)。若\(f(x),g(x)\)在复数域上没有公共根,证明: \(f(B),g(A)\)都是可逆矩阵。