相似与对角化 定义 4.2.1. 两个 n 阶方阵 A 与 B 称为是相似的, 如果存在 n 阶可逆方阵 P 使得A=PBP−1
容易验证, 相似关系构成一个等价关系, 即满足
•
自反性: A 与 A 相似
•
对称性: 若 A 与 B 相似, 则 B 与 A 相似
•
传递性: 若 A 与 B 相似, B 与 C 相似, 则 A 与 C 相似
命题 4.2.2. 如果 A 与 B 相似, f(x) 是任意一个多项式. 则 f(A) 与 f(B) 相似.
证明: 设 A=PBP−1. 则对任意正整数 mAm=(PBP−1)(PBP−1)⋯(PBP−1)=PBmP−1由此易知 f(A)=P f(B) P−1.□
命题 4.2.3. 如果 A 与 B 相似, 则它们具有相同的特征多项式. 特别地, 我们有TrA=TrBdetA=detB
证明: 设 A=PBP−1. 则det(λI−A)===det(λI−PBP−1)=det(P(λI−B)P−1)det(P)det(λI−B)det(P−1)det(λI−B) □
定义 4.2.4. n 阶方阵 A 称为可对角化, 如果 A 相似于一个对角阵 diag(λ1,⋯,λn). 这里diag(λ1,⋯,λn):=⎣⎡λ10⋯00λ2⋯⋯⋯⋯⋯000⋯λn⎦⎤
如果 A 相似于 diag(λ1,⋯,λn), 则 A 的特征多项式和这个对角阵相同φ(λ)=(λ−λ1)(λ−λ2)⋯(λ−λn)因此这个对角阵的元素即为 A 的特征值.
假设 A 可对角化, A=Pdiag(λ1,⋯,λn)P−1, 即AP=Pdiag(λ1,⋯,λn)记 P 的列向量为 {β1,⋯,βn}P=[β1β2⋯βn]由 P 可逆知 rankP=n, 因此 {β1,⋯,βn} 构成一组基.
等式 A=Pdiag(λ1,⋯,λn)P−1 可以写成A[β1β2⋯βn]=[β1β2⋯βn]⎣⎡λ10⋯00λ2⋯⋯⋯⋯⋯0000λn⎦⎤即Aβi=λiβi,i=1,⋯,n这说明 βi 是属于 λi 的特征向量. 由上述讨论, 我们证明了如下结论
命题 4.2.5. n 阶方阵 A 可对角化当且仅当存在一组基 {β1,⋯,βn} 使得每个 βi 都是 A 的特征向量.
在这个情况下, 我们把任意向量 x 通过基 {β1,⋯,βn} 来线性表达: x=i∑ciβi. 则矩阵 A 乘在向量 x 上很容易计算出Ax=i∑ciλiβi
例子 4.2.6. 并不是每个方阵都可以对角化, 例如A=⎣⎡λ00⋯001λ0⋯0001⋯⋯⋯⋯⋯⋯λ0000⋯1λ0⎦⎤A 的特征值只有 λ0, 我们考虑它的特征向量. 齐次线性方程组(λ0In−A)x=0⟺⎣⎡00⋯00−10⋯000−1⋯⋯⋯⋯⋯⋯0000⋯−10⎦⎤⎣⎡x1x2⋮xn−1xn⎦⎤=0的解为 x1=c,x2=x3=⋯=xn=0. 因此 λ0 的特征向量只有一个线性无关的元素, 它不可能构成 n 维空间 (n>1) 的一组基. 这说明方阵 A 不可对角化.
命题 4.2.7. 如果数域 k 上 n 阶方阵 A 具有 n 个互不相同的特征值在 k 中, 则 A 可以对角化.
证明: 设 A 的特征值为 λ1,⋯,λn. 由假设这些特征值互不相同. 设 βi 是属于 λi 的一个特征向量. 我们下面证明 {β1,⋯,βn} 线性无关. 由此知 {β1,⋯,βn} 构成 n 维空间的一组基, 因此 A 可对角化.假设有系数 c1,⋯,cn 使得c1β1+c2β2+⋯+cnβn=0两边依次乘以 A,A2,⋯,An−1, 我们得到⎩⎨⎧c1β1+c2β2+⋯+cnβn=0λ1c1β1+λ2c2β2+⋯+λncnβn=0⋯⋯λ1n−1c1β1+λ2n−1c2β2+⋯+λnn−1cnβn=0
我们可以把这组方程写成矩阵的形式[c1β1c2β2⋯cnβn]⎣⎡11⋯1λ1λ2⋯λnλ12λ22⋯λn2⋯⋯⋯⋯λ1n−1λ2n−1⋯λnn−1⎦⎤=0记 P=[c1β1c2β2⋯cnβn], Q=⎣⎡11⋯1λ1λ2⋯λnλ12λ22⋯λn2⋯⋯⋯⋯λ1n−1λ2n−1⋯λnn−1⎦⎤, 则上式为PQ=0
由 Vandermonde 行列式detQ=i>j∏(λi−λj)=0故 Q 可逆. 因此 PQ=0⟹P=0, 即 P 的每列 ciβi=0. 由于 βi 都是非零向量, 我们得出 ci=0,i=1,⋯,n. 这证明了 {β1,⋯,βn} 是线性无关的向量.□
例子 4.2.8. 设 A=⎣⎡200131001⎦⎤, 计算 A100.
我们首先计算 A 的特征多项式
∣∣λ−200−1λ−3−100λ−1∣∣=(λ−2)(λ−3)(λ−1)A 有 3 个不同的特征值 2,3,1, 因此可对角化.
我们计算特征值 λ1=2,λ2=3,λ3=1 对应的特征向量 β1,β2,β3(λ1−A)β1=⎣⎡000−1−1−1001⎦⎤β1=0(λ2−A)β2=⎣⎡100−10−1002⎦⎤β2=0(λ3−A)β3=⎣⎡−100−1−2−1000⎦⎤β3=0取β1=⎣⎡100⎦⎤取β2=⎣⎡221⎦⎤取β3=⎣⎡001⎦⎤
记矩阵P=[β1β2β3]=⎣⎡100221001⎦⎤容易计算P−1=⎣⎡100−11/2−1/2001⎦⎤
我们得到相似变化 A=P⎣⎡200030001⎦⎤P−1. 因此A100===P⎣⎡200030001⎦⎤100P−1=P⎣⎡210000031000001⎦⎤P−1⎣⎡100221001⎦⎤⎣⎡210000031000001⎦⎤⎣⎡100−11/2−1/2001⎦⎤⎣⎡2100003100−21003100(3100−1)/2001⎦⎤
相似变换的几何含义 设 f:kn→kn 是一个线性映射. 我们知道可以把 f 对应于一个 n 阶方阵 A. 具体而言, 取 kn 的标准基 {e1,⋯,en}, 计算f(ej)=i∑aijei则 A=(aij). 实际上, 除了标准基, 我们也可以取另外一组基作类似的构造.
定义 4.2.9. 设 f:kn→kn 是一个线性映射. 给定 kn 的一组基 {α1,⋯,αn}, 设f(αj)=i∑aijαi则方阵 A=(aij) 称为 f 在这组基 {α1,⋯,αn} 下的表示矩阵.
我们把 f 在基 {α1,⋯,αn} 下的表示矩阵写成矩阵关系[f(α1)f(α2)⋯f(αn)]=[α1α2⋯αn]⎣⎡a11a21⋯an1a12a22⋯an2⋯⋯⋯⋯a1na2n⋯ann⎦⎤
如果我们取 kn 中两组不同的基 {α1,⋯,αn} 和 {β1,⋯,βn}. 设 f 在基 {α1,⋯,αn} 下的表示矩阵为 A, 在基 {β1,⋯,βn} 下的表示矩阵为 B. 那么矩阵 A 和 B 是什么关系?
由于 {α1,⋯,αn} 是一组基, 我们可以把向量 βj 在这组基下作线性展开βj=i∑pijαi写成矩阵的形式[β1β2⋯βn]=[α1α2⋯αn]⎣⎡p11p21⋯pn1p12p22⋯pn2⋯⋯⋯⋯p1np2n⋯pnn⎦⎤这个 n 阶方阵 P=(pij) 称为从基 {α1,⋯,αn} 到基 {β1,⋯,βn} 的过渡矩阵.
命题 4.2.10. 一组基 {α1,⋯,αn} 到另一组基 {β1,⋯,βn} 的过渡矩阵 P 是可逆矩阵, 且 P−1 是基 {β1,⋯,βn} 到基 {α1,⋯,αn} 的过渡矩阵.
证明: 设 {α1,⋯,αn} 到基 {α1,⋯,αn} 的过渡矩阵为 Q. 则[β1β2⋯βn]=[α1α2⋯αn]P[α1α2⋯αn]=[β1β2⋯βn]Q把两个等式复合, 我们得到[α1α2⋯αn]=[α1α2⋯αn]PQ即[α1α2⋯αn](In−PQ)=0由 {αi} 的线性无关性, 我们得到 PQ=In.□
定理 4.2.11. 设线性映射 f:kn→kn 在基 {α1,⋯,αn} 下的表示矩阵为 A, 在基 {β1,⋯,βn} 下的表示矩阵为 B. 设基 {α1,⋯,αn} 到基 {β1,⋯,βn} 的过渡矩阵为 P. 则A=PBP−1
证明: 过渡矩阵关系为[β1β2⋯βn]=[α1α2⋯αn]P由于 f 是线性映射, 两边作用映射 f 给出[f(β1)f(β2)⋯f(βn)]=[f(α1)f(α2)⋯f(αn)]P代入 f 在基下表示矩阵的关系[f(α1)f(α2)⋯f(αn)]=[f(β1)f(β2)⋯f(βn)]=[α1α2⋯αn]A[β1β2⋯βn]B我们得到[β1β2⋯βn]B=[α1α2⋯αn]AP
再次代入过渡矩阵关系, 上述等式变为
[α1α2⋯αn]PB=[α1α2⋯αn]AP即[α1α2⋯αn](PB−AP)=0由 {αi} 的线性无关性, 我们得到 PB=AP.□
注记. 这个命题给出了相似变换的几何含义: 相似变换是同一个线性映射 f:kn→kn 在不同基下表示矩阵之间的变换.