主要内容

高等代数教学辅导

6.3 极小多项式

建设中!

子节 6.3.1 主要知识点

定义 6.3.1.

\(A\in\mathbb{F}^{n\times n},\ 0\neq f(\lambda)=a_s\lambda^s+a_{s-1}\lambda^{s-1}+\cdots +a_0\in\mathbb{F} [\lambda]\)。 若成立
\begin{equation*} f(A)=a_sA^s+a_{s-1}A^{s-1}+\cdots +a_0{\color{blue}E}=0, \end{equation*}
则称\(A\)适合多项式\(f(\lambda)\), 或称\(f(\lambda)\)\(A\)零化多项式

证明.

\(B(\lambda)\)\(\lambda\)-矩阵\(\lambda E -A\)的伴随矩阵,则
\begin{equation} B(\lambda)(\lambda E-A)= \det(\lambda E-A) E= f_A(\lambda)E. \tag{6.1} \end{equation}
\(B(\lambda)\)的每一个元素都是矩阵\(\lambda E-A\)的某一个\(n-1\)阶代数余子式,所以这些元素都是次数不超过\(n-1\)的关于\(\lambda\)的一元多项式,从而\(B(\lambda)\) 可拆分为
\begin{equation*} B(\lambda)= \lambda^{n-1}B_{n-1}+\lambda^{n-2}B_{n-2}\cdots +B_0, \end{equation*}
这里\(B_i (i=0,1,\ldots,n-1)\)都是\(\mathbb{F}\)上的\(n\)阶方阵。代入\(B(\lambda)(\lambda E-A)\)得:
\begin{equation} \begin{array}{rcl} & & B(\lambda)(\lambda E-A) = (\lambda^{n-1}B_{n-1}+\lambda^{n-2}B_{n-2}\cdots +B_0)(\lambda E-A)\\ & = & \lambda^n B_{n-1} +\lambda^{n-1}(B{n-2}-B_{n-1}A)+\cdots+\lambda(B_0-B_{1}A) - B_0A. \end{array}\tag{6.2} \end{equation}
\(A\)的特征多项式\(f_A(\lambda)=\lambda^n+a_{n-1}\lambda^{n-1}+\cdots+a_0\),则
\begin{equation} f_A(\lambda)E=\lambda^n E+a_{n-1}\lambda^{n-1}E+\cdots+a_0E.\tag{6.3} \end{equation}
根据(6.1)(6.2)(6.3) 得:
\begin{equation} \left\{\begin{array}{l} B_{n-1}=E,&\\ B_{n-2}-B_{n-1}A=a_{n-1}E,&\\ \vdots&\\ B_0-B_1A=a_1E,&\\ -B_0A=a_0E& \end{array}\right.\tag{6.4} \end{equation}
\(A^n,A^{n-1},\cdots,A,E\)按顺序右乘(6.4)
\begin{equation} \left\{\begin{array}{l} B_{n-1}A^n=A^n,&\\ B_{n-2}A^{n-1}-B_{n-1}A^n=a_{n-1}A^{n-1},&\\ \vdots&\\ B_0A-B_1A^2=a_1A,&\\ -B_0A=a_0E& \end{array}\right. \tag{6.5} \end{equation}
(6.5)的所有等式加到一起,左边为0,右端即为\(f_A(A)\),结论成立。
注:教材中的证明是局限在有\(\mathbb{F}\)是复数域\(\mathbb{C}\)的子域这一前提下给出的,这个证明对于初学者友好且直观。事实上,Cayley-Hamilton定理对一般数域也是成立的。上面的证明是为了应对一般情形。

定义 6.3.4.

\(A\)是数域\(\mathbb{F}\)上的\(n\)阶方阵,\(A\)的次数最小且首一的零化多项式称为\(A \)极小多项式

定义 6.3.10.

\(\varphi\)是数域\(\mathbb{F}\)\(n\)维空间\(V\)的线性变换,若存在
\begin{equation*} 0\neq f(\lambda)=a_s\lambda^s+a_{s-1}\lambda^{s-1}+\cdots +a_0\in\mathbb{F} [\lambda], \end{equation*}
使得
\begin{equation*} f(\varphi)=a_s\varphi^s+a_{s-1}\varphi^{s-1}+\cdots +a_0 id_V=0, \end{equation*}
则称\(f(\lambda)\)\(\varphi\)零化多项式
\(\varphi\)的次数最低的且首项系数为\(1\)的零化多项式称为\(\varphi\)的极小多项式,记作\(m_{\varphi}(\lambda)\)

练习 6.3.2 练习

1.

举例说明特征值相同的矩阵未必相似,极小多项式相同的矩阵未必相似。
解答.
\begin{equation*} A=\begin{pmatrix} 0&1&0&0\\ 0&0&0&0\\ 0&0&0&1\\ 0&0&0&0 \end{pmatrix},B=\begin{pmatrix} 0&1&0&0\\ 0&0&0&0\\ 0&0&0&0\\ 0&0&0&0 \end{pmatrix}, \end{equation*}
\(f_A(\lambda)=f_B(\lambda)=\lambda^4,m_A(\lambda)=m_B(\lambda)=\lambda^2\)。但\(r(A)=2\neq 1=r(B)\),故\(A\)\(B\)不相似。

2.

\(A= \begin{pmatrix} 2&1&1\\1&2&1\\1&1&2 \end{pmatrix}\),求\(A\)的极小多项式\(m_A(\lambda)\),并判断\(A\)是否可对角化。
解答.
\(f_A(\lambda)=\begin{vmatrix} \lambda-2&-1&-1\\-1&\lambda-2&-1\\-1&-1&\lambda-2 \end{vmatrix}=(\lambda-1)^2(\lambda-4)\),所以
\begin{equation*} m_A(\lambda)=(\lambda-1)(\lambda-4)\mbox{或}(\lambda-1)^2(\lambda-4)\mbox{。} \end{equation*}
注意到
\begin{equation*} (A-E)(A-4E)=\begin{pmatrix} 1&1&1\\1&1&1\\1&1&1 \end{pmatrix}\begin{pmatrix} -2&1&1\\1&-2&1\\1&1&-2 \end{pmatrix}=\begin{pmatrix} 0&0&0\\0&0&0\\0&0&0 \end{pmatrix}, \end{equation*}
\(A\)的极小多项式\(m_A(\lambda)=(\lambda-1)(\lambda-4)\)。 因\(A\)的极小多项式\(m_A(\lambda)\)是互素一次因式的乘积,故\(A\)可对角化。

3.

\(\alpha , \beta\in\mathbb{F}^n\),且\(\alpha^T \beta=1\)。令\(A=E_n- \alpha \beta^T\),求\(A\)的极小多项式\(m_A(\lambda)\),并判断\(A\)是否可对角化。
解答.
\(\beta^T \alpha=(\alpha^T \beta)^T=1\),所以
\begin{equation*} \begin{array}{ccl}f_A(\lambda)&=&\det\left(\lambda E_n-(E_n- \alpha \beta^T)\right)\\ &=&\det\left((\lambda-1)E_n+ \alpha \beta^T\right)\\ &=&(\lambda-1)^{n-1}\det \left((\lambda-1)E_1+\beta^T \alpha\right)\\ &=&\lambda(\lambda-1)^{n-1}\mbox{,} \end{array} \end{equation*}
\(A\)的极小多项式\(m_A(\lambda)\)\(\lambda(\lambda-1)^k\),其中\(1\leq k\leq n-1\)。注意到
\begin{equation*} A(A-E)=(E_n- \alpha \beta^T)(- \alpha \beta^T)=- \alpha \beta^T+ \alpha (\beta^T \alpha) \beta^T=0, \end{equation*}
因此\(A\)的极小多项式\(m_A(\lambda)=\lambda(\lambda-1)\)\(A\)的极小多项式\(m_A(\lambda)\)是互素一次因式的乘积,故\(A\)可对角化。

4.

\(n\)阶可逆矩阵\(A\)的极小多项式\(m_A(\lambda)=\lambda^m+a_1 \lambda^{m-1}+\cdots +a_m\),求\(A^{-1}\)的极小多项式\(m_{A^{-1}}(\lambda)\)
解答.
因为\(A\)可逆,所以\(a_m\neq 0\)。由于
\begin{equation*} m_A(A)=A^m+a_1 A^{m-1}+\cdots +a_{m-1}A+a_mE_n=0, \end{equation*}
两边同时左乘\(A^{-m}\),得
\begin{equation*} E_n+a_1 A^{-1}+\cdots +a_{m-1}A^{-m+1}+a_mA^{-m}=0\mbox{。} \end{equation*}
\(f(\lambda)=\lambda^m+\frac{a_{m-1}}{a_m}\lambda^{m-1}+\cdots+\frac{a_{1}}{a_m}\lambda+\frac{1}{a_m}\)\(A^{-1}\)的一个零化多项式。我们断言\(f(\lambda)\)恰是\(A^{-1}\)的极小多项式。若不然,存在次数小于\(m\)的多项式
\begin{equation*} g(\lambda)=\lambda^k+b_{k-1}\lambda^{k-1}+\cdots +b_1 \lambda+b_0, \end{equation*}
其中\(k<m\),使得\(g(A^{-1})=0\),即\(A^{-k}+b_{k-1}A^{1-k}+\cdots +b_1 A^{-1}+b_0E_0=0\),两边同时左乘\(A^k\),得
\begin{equation*} b_0A^k+b_1A^{k-1}+\cdots +b_{k-1}A+E_n=0, \end{equation*}
\(\deg m_A(\lambda)=m\)相矛盾。故\(m_{A^{-1}}(\lambda)=\lambda^m+\frac{a_{m-1}}{a_m}\lambda^{m-1}+\cdots+\frac{a_{1}}{a_m}\lambda+\frac{1}{a_m}\)

5.

\(A\)是数域\(\mathbb{F}\)\(n\)阶矩阵,证明:\(m_A(\lambda)=m_{A^T}(\lambda)\)
解答.
\(m_A(\lambda)=\lambda^m+a_{m-1}\lambda^{m-1}+\cdots +a_1 \lambda+a_0\),则
\begin{equation*} A^m+a_{m-1}A^{m-1}+\cdots +a_1A+a_0E_n=0, \end{equation*}
两边同时取转置,得
\begin{equation*} (A^T)^m+a_{m-1}(A^T)^{m-1}+\cdots +a_1A^T +a_0E_n=0, \end{equation*}
\(m_A(A^T)=0\),即\(m_A(\lambda)\)\(A^T\)的一个零化多项式。因此\(m_{A^T}(\lambda)|m_A(\lambda)\)。同理可证,\(m_{A}(\lambda)|m_{A^T}(\lambda)\)。又\(m_A(\lambda),m_{A^T}(\lambda)\)均为首一多项式,所以\(m_A(\lambda)=m_{A^T}(\lambda)\)

6.

\(A={{\rm {diag}}}\{A_1,A_2,\cdots ,A_s\}\)是数域\(\mathbb{F}\)上的\(n\)阶方阵,其中\(A_i(i=1,2,\cdots ,s)\)\(n_i\)阶方阵。证明\(A\)可对角化的充分必要条件是每个\(A_i(i=1,2,\cdots ,s)\)都可对角化。
解答.
\(A={{\rm {diag}}}\{A_1,A_2,\cdots ,A_s\}\),所以
\begin{equation*} m_A(\lambda)=\left[m_{A_1}(\lambda),m_{A_2}(\lambda),\cdots,m_{A_s}(\lambda)\right]\mbox{。} \end{equation*}
\begin{equation*} \begin{array}{ccl} A\mbox{可对角化}&\Leftrightarrow&m_A(\lambda)\mbox{是上互素一次因式的乘积}\\ &\Leftrightarrow&\left[m_{A_1}(\lambda),m_{A_2}(\lambda),\cdots,m_{A_s}(\lambda)\right]\mbox{是上互素一次因式的乘积}\\ &\Leftrightarrow&\forall 1\leq i\leq s\mbox{,}m_{A_i}(\lambda)\mbox{是上互素一次因式的乘积}\\ &\Leftrightarrow&\forall 1\leq i\leq s\mbox{,}A_i\mbox{都可对角化。} \end{array} \end{equation*}

7.

\(A,B\)都是\(n\)阶可对角化矩阵,并且\(AB=BA\),证明:\(A,B\)可同时对角化,即存在可逆矩阵\(P\)使得\(P^{-1}AP\)\(P^{-1}BP\)都是对角矩阵。
解答.
因为\(A\)可对角化,所以存在可逆矩阵\(P_1\),使得
\begin{equation*} P_1^{-1}AP_1={{\rm {diag}}}\{\lambda_1E_{r_1},\lambda_2E_{r_2},\cdots ,\lambda_sE_{r_s}\}, \end{equation*}
其中\(\lambda_1,\lambda_2,\cdots ,\lambda_s\)互不相同。由\(AB=BA\)知,
\begin{equation*} (P_1^{-1}AP_1)(P_1^{-1}BP_1)=(P_1^{-1}BP_1)(P_1^{-1}AP_1)\mbox{。} \end{equation*}
\(C=P_1^{-1}BP_1=\left(C_{ij}\right)\),其中\(C_{ij}\)\(r_i\times r_j\)矩阵,则\(\lambda_i C_{ij}=\lambda_j C_{ij}\)。当\(i\neq j\)时,由\(\lambda_i\neq \lambda_j\)\(C_{ij}=0\),故\(C={{\rm {diag}}}\{C_{11},C_{22},\cdots ,C_{ss}\}\)。由\(B\)可对角化知:\(C\)可对角化,根据上题结论,对任意\(1\leq i\leq s\),存在可逆矩阵\(Q_i\),使得\(Q_i^{-1}C_{ii}Q_i\)为对角阵。令\(P=P_1{{\rm {diag}}}\{Q_{1},Q_{2},\cdots ,Q_{s}\}\),则\(P\)可逆且
\begin{equation*} P^{-1}AP={{\rm {diag}}}\{\lambda_1E_{r_1},\lambda_2E_{r_2},\cdots ,\lambda_sE_{r_s}\}, \end{equation*}
\begin{equation*} P^{-1}BP={{\rm {diag}}}\{Q_1^{-1}C_{11}Q_1,Q_2^{-1}C_{22}Q_2,\cdots ,Q_s^{-1}C_{ss}Q_s\} \end{equation*}
都是对角矩阵。

8.

\(S\)是无限个可对角化的\(n\)阶方阵组成的集合,其元素满足矩阵乘法交换律。证明:存在\(n\)阶可逆矩阵\(P\),使得\(\forall X\in S\)\(P^{-1}XP\)为对角矩阵。
解答.
\(S\subseteq\mathbb{F}^{n\times n}\),且\(\dim\mathbb{F}^{n\times n}<\infty\),所以存在\(A_1,A_2,\cdots ,A_s\in S\),使得\(\forall A\in S\)\(A\)可由\(A_1,A_2,\cdots ,A_s\)线性表出。
下证存在\(n\)阶可逆矩阵\(P\),使得\(\forall 1\leq k\leq s\)\(P^{-1}A_kP\)为对角矩阵即可。对阶数\(n\)用第二归纳法。
(1). 当\(n=1\)时,结论显然成立。
(2). 假设对于小于\(n\)阶的矩阵结论成立,以下考虑\(n\)阶矩阵的情形。因为\(A_s\)可对角化,所以存在可逆矩阵\(P_1\),使得
\begin{equation*} P_1^{-1}A_sP_1={{\rm {diag}}}\{\lambda_1E_{r_1},\lambda_2E_{r_2},\cdots ,\lambda_mE_{r_m}\}, \end{equation*}
其中\(\lambda_1,\lambda_2,\cdots ,\lambda_m\)互不相同。对任意\(1\leq i\leq s-1\),由\(A_i A_s=A_s A_i\)
\begin{equation*} (P_1^{-1}A_iP_1)(P_1^{-1}A_sP_1)=(P_1^{-1}A_sP_1)(P_1^{-1}A_iP_1), \end{equation*}
\(P_1^{-1}A_iP_1={{\rm {diag}}}\{B_{i1},B_{i2},\cdots ,B_{im}\}\)。故\(\forall 1\leq j\leq s\)
\begin{equation*} P_1^{-1}A_jP_1={{\rm {diag}}}\{B_{j1},B_{j2},\cdots ,B_{jm}\}\mbox{。} \end{equation*}
于是,对任意\(1\leq k\neq l\leq s\),由\(A_kA_l=A_lA_k\)不难推出
\begin{equation*} B_{kt}B_{lt}=B_{lt}B_{kt},\forall 1\leq t\leq m, \end{equation*}
其中\(B_{kt},B_{lt}\)\(r_t\)阶方阵。由归纳假设,存在\(r_t\)阶可逆矩阵\(Q_t\),使得\(\forall 1\leq k\leq s,\ Q_t^{-1}B_{kt}Q_t\)为对角矩阵。令
\begin{equation*} P=P_1 \begin{pmatrix} Q_1&&&\\ &Q_2&&\\ &&\ddots&\\ &&&Q_m \end{pmatrix}, \end{equation*}
\(P\)\(n\)阶可逆矩阵,且\(\forall 1\leq k\leq s,\ P^{-1}A_kP\)均为对角矩阵。 因此\(\forall X\in S\)\(P^{-1}XP\)为对角矩阵。

9.

\(A,B\)\(n\)阶矩阵,若\((m_A(\lambda),m_B(\lambda))=1\),证明:\(f_A(B)\)是可逆矩阵,这里\(f_A(\lambda)\)\(A\)的特征多项式。
解答.
因为\((m_A(\lambda),m_B(\lambda))=1\),所以\((f_A(\lambda),m_B(\lambda))=1\)。否则,\(f_A(\lambda)\)\(m_B(\lambda)\)\(\mathbb{C}\)上有公共根\(c\)。因\(f_A(\lambda)\)\(m_A(\lambda)\)\(\mathbb{C}\)上的根在不计重数条件下是相同的,所以\(c\)也是\(m_A(\lambda)\)\(m_B(\lambda)\)的公共根,与\((m_A(\lambda),m_B(\lambda))=1\)相矛盾。故\((f_A(\lambda),m_B(\lambda))=1\)。于是,存在\(u(\lambda),v(\lambda)\),使得
\begin{equation*} u(\lambda)f_A(\lambda)+v(\lambda)m_B(\lambda)=1. \end{equation*}
\(B\)代入上式两边的\(\lambda\),因\(m_B(B)=0\),故
\begin{equation*} u(B)f_A(B)=E_n, \end{equation*}
从而\(f_A(B)\)是可逆矩阵。

10.

\(A,B\)分别是数域\(\mathbb{F}\)上的\(n\)阶、\(m\)阶矩阵,其极小多项式分别为\(m_A(\lambda),m_B(\lambda)\),若\((m_A(\lambda),m_B(\lambda))=1\),证明:矩阵方程\(AX=XB\)只有零解。
解答.
因为\((m_A(\lambda),m_B(\lambda))=1\),所以存在\(u(\lambda),v(\lambda)\),使得
\begin{equation*} u(\lambda)m_A(\lambda)+v(\lambda)m_B(\lambda)=1, \end{equation*}
\(A\)代入上式两边的\(\lambda\),因\(m_A(A)=0\),故
\begin{equation*} v(A)m_B(A)=E_n\mbox{。} \end{equation*}
对矩阵方程\(AX=XB\)任一解\(X_0\),有\(A X_0=X_0 B\),则
\begin{equation*} A^2 X_0=A(X_0 B)=(A X_0)B=(X_0 B)B=X_0 B^2, \end{equation*}
\begin{equation*} A^3 X_0=A(X_0 B^2)=(A X_0)B^2=X_0 B^3,\cdots, \end{equation*}
\(m_B(A)X_0=X_0 m_B(B)=0\)。因此,
\begin{equation*} X_0=E_n X_0=v(A)m_B(A) X_0=v(A)0=0\mbox{。} \end{equation*}
从而矩阵方程\(AX=XB\)只有零解。