1、15.1 向量的内积、长度及正交性向量的内积、长度及正交性 在解析几何中有两向量的在解析几何中有两向量的数量积数量积的概念的概念, 即设即设x, y为两向量为两向量, 则它们的数量积为则它们的数量积为:x y = | x | y | cos . 设向量设向量x, y 的坐标表示式为的坐标表示式为 x = (x1, x2, x3), y = (y1, y2, y3), 则则x y = x1 y1 + x2 y2 + x3 y3 .,|232221xxxx .|arccosyxyx 由此引出了向量的由此引出了向量的长度长度(即即模模)和两向量和两向量夹角夹角的概念的概念:2定义定义1: 设有设有n
2、维向量维向量,2121 nnyyyyxxxxx, y = x1 y1 + x2 y2 + + xn yn,称称x, y为向量为向量 x 与与 y 的的内积内积. 说明说明1. n(n 4)维向量的内积是维向量的内积是3维向量维向量数量积数量积的的推广推广. 但但n维向量没有维向量没有3维向量直观的几何意义维向量直观的几何意义. 说明说明2. 内积是向量的一种运算内积是向量的一种运算, 如果都是列向量如果都是列向量, 内积可用矩阵记号表示为内积可用矩阵记号表示为: x, y = xT y.我们把两向量的我们把两向量的数量积数量积的概念向的概念向 n 维向量推广维向量推广:记记3内积的运算性质内积
3、的运算性质设设x, y, z为为n维向量维向量, 为实数为实数, 则则(1) x, y = y, x;(2) x, y = x, y;(3) x+y , z = x, z + y, z;(4) x, x 0, 当且仅当当且仅当x=0时有时有x, x=0.称称| x |为为n维向量维向量 x 的的长度长度(或或范数范数).,|22221nxxxxxx 定义定义: 令令向量的长度具有下述性质向量的长度具有下述性质:(1) 非负性非负性: | x | 0, 当且仅当当且仅当x=0时有时有| x | = 0;(2) 齐次性齐次性: | x| = | | | x |;(3) 三角不等式三角不等式: |
4、x+y | | x | + | y |.4|,cosyxyx ,2262318 .4 |,arccosyxyx 单位向量及单位向量及n 维向量间的夹角维向量间的夹角(1)当当| x |=1时时, 称称x为为单位向量单位向量.(2)当当| x | 0, | y | 0 时时, 称为称为n维向量维向量 x 与与 y 的的夹角夹角, 规定规定0 .例例1: 求向量求向量x = (1, 2, 2, 3)与与y = (3, 1, 5, 1)的夹角的夹角.解解: x, y=1 3+2 1+2 5+3 1=18, ,183221|2222 x,361513|2222 y所以所以故故, 向量向量x与与 y 的
5、夹角为的夹角为:51. 正交的概念正交的概念2. 正交向量组的概念正交向量组的概念若一非零向量组中的向量两两正交若一非零向量组中的向量两两正交, 则称该向量则称该向量组为组为正交向量组正交向量组.当当x, y=0时时, 称向量称向量 x 与与 y 正交正交.由定义知由定义知, 若若x=0, 则则 x与任何向量都正交与任何向量都正交.3. 正交向量组的性质正交向量组的性质 定理定理1: 若向量组若向量组 1, 2, , r 是是n维维正交向量组正交向量组, 则则 1, 2, , r 线性无关线性无关.证明证明: 设有数设有数 1, 2, , r, 使得使得: 1 1 + 2 2 + + r r
6、= 0向量的正交是几何空间中向量垂直概念的推广向量的正交是几何空间中向量垂直概念的推广.6由于由于 1, 2, , r 是是两两正交的非零向量组两两正交的非零向量组,当当 i j 时时, i, j= iT j = 0, 当当 i = j 时时, i, i= iT i 0,则有则有用用 iT ( i =1, 2, , r )左乘上式得左乘上式得, 1 iT 1 + + i iT i + + r iT r = iT0 = 0, i iT i = 0.即即从而得从而得, 1= 2= = r=0,所以所以 1, 2, , r 线性无关线性无关.4. 向量空间的正交基向量空间的正交基 定义定义: 若正交
7、向量组若正交向量组 1, 2, , r是向量空间是向量空间V的的一组基一组基, 则称则称 1, 2, , r 是向量空间是向量空间V的一组的一组正交基正交基.例例2: 已知三维向量空间中两个向量已知三维向量空间中两个向量正交正交. 试求试求 3使使 1, 2, 3构成三维空间的一组正交基构成三维空间的一组正交基. 1=(1, 1, 1)T, 2=(1, 2, 1)T7即即.02,0,3213232131 xxxxxx 解之得解之得解解: 设设 3=(x1, x2, x3)T 0, 且分别与且分别与 1, 2正交正交. 则有则有 1, 3= 2, 3=0,x1 = x3, x2 = 0.1013
8、213 xxx 若令若令 x3 = 1, 则有则有,101,121,111321 构成三维空间的一组正交基构成三维空间的一组正交基.则则85. 规范正交基规范正交基.212100,212100,002121,0021214321 eeee例如例如 定义定义: 设设n维向量组维向量组e1, e2, , er是向量空间是向量空间V Rn的一组正交基的一组正交基, 且都是单位向量且都是单位向量, 则称则称e1, e2, , er是向是向量空间量空间V的一组的一组规范规范(单位单位)正交基正交基.).4, 3, 2, 1,(10, jijijieeijji 由于由于所以所以, e1, e2, e3,
9、e4为为R4的一组规范正交基的一组规范正交基.9.1000,0100,0010,00014321 同理可知同理可知也为也为R4的一组规范正交基的一组规范正交基(即即单位坐标向量组单位坐标向量组). 设设e1, e2, , er是向量空间是向量空间V的一组的一组规范规范正交基正交基, 则则V中的任一向量中的任一向量a可由可由e1, e2, , er线性表示线性表示, 设表示式为设表示式为:a = 1e1 + 2e2 + + rer ,用用eiT左乘上式左乘上式, 有有 eiTa = i eiTei = i ,即即 i = eiTa = a, ei,这就是向量在规范正交基中的这就是向量在规范正交基
10、中的坐标坐标(即即线性表示系数线性表示系数)的计算公式的计算公式. 利用该公式可方便地计算向量在规范正利用该公式可方便地计算向量在规范正交基中的交基中的坐标坐标, 因此我们常取向量空间的因此我们常取向量空间的规范正交基规范正交基.106. 求规范正交基的方法求规范正交基的方法 已知已知 1, 2, , r 是向量空间是向量空间V 的一组基的一组基, 求求V 的的一组规范正交基一组规范正交基, 就是要找一组两两正交的单位向量就是要找一组两两正交的单位向量e1, e2, , er , 使使e1, e2, , er 与与 1, 2, , r 等价等价, 这样这样一个问题称为一个问题称为把基把基 1,
11、 2, , r 规范正交化规范正交化.(1) 正交化正交化设设a1, a2, , ar 是向量空间是向量空间V 的一组基的一组基. ,1112122bbbabab ,222321113133bbbabbbbabab 取取 b1 = a1,11111122221111, rrrrrrrrrbbbabbbbabbbbabab 则则b1, b2, , br两两正交两两正交, 且且b1, b2, , br与与a1, a2, ,ar等价等价.(2) 单位化单位化, 取取,|,|,|222111rrrbbebbebbe 则则e1, e2, , en是向量空间是向量空间V的一组的一组规范正交基规范正交基.
12、上述由线性无关向量组上述由线性无关向量组a1, a2, , ar 构造出正交向构造出正交向量组量组b1, b2, , br 的过程称为的过程称为施密特施密特(Schimidt)正交化正交化过程过程.12 例例3: 用施密特正交化方法用施密特正交化方法, 将向量组将向量组a1=(1, 1, 1, 1), a2=(1, -1, 0, 4), a3=(3, 5, 1, -1)正交规范化正交规范化.解解: 先先正交化正交化.1112122,bbbabab )1 , 1 , 1 , 1(1111411)4, 0, 1, 1( ),3, 1, 2, 0( 取取b1= a1=(1, 1, 1, 1),222
13、321113133,bbbabbbbabab )3, 1, 2, 0(1414)1 , 1 , 1 , 1(48)1, 1 , 5, 3( ),0, 2, 1 , 1( 13再再单位化单位化.得规范正交向量组如下得规范正交向量组如下:),143,141,142, 0()3, 1, 2, 0(141|222 bbe).0,62,61,61()0, 2, 1, 1(61|333 bbe),21,21,21,21()1 , 1 , 1 , 1(21|111 bbe例例4: 设设,014,131,121321 aaa试用施密特正交化过程把这组向量规范正交化试用施密特正交化过程把这组向量规范正交化.14
14、bbbaab1211222|, 12164131;11135 bbbabbbaab2223111333|,|, 解解: 先先正交化正交化. 取取b1= a1 1113512131014.1012 ,121 15|111bbe ,12161 |222bbe ,11131 |333bbe .10121 再再单位化单位化.得规范正交向量组如下得规范正交向量组如下:故故, e1, e2, e3 即为所求即为所求.例例5: 已知已知,1111 a求一组非零向量求一组非零向量a2, a3, 使使a1, a2, a3两两正交两两正交.解解: 非零向量非零向量a2, a3应满足方程应满足方程 a1Tx = 0
15、, 即即x1+ x2+ x3= 0.16.110,10121 它的基础解系为它的基础解系为:把基础解系正交化把基础解系正交化, 即为所求即为所求. 亦即取亦即取,12 a.,1112123 a其中其中 1, 2=1, 1, 1=2,于是得于是得,1012 a.12121101211103 a17a1a3a2b1c2b2c3c31c32b3例例 4 的几的几 何何 解解 释释,|,|,12112111122bbbabbbbac b2 = a2 c2, c2为为a2在在b1上的上的投影向量投影向量, 即即b1 = a1, b3 = a3 c3, c3为为a3在在b1, b2所确定的平面上的投影向量
16、所确定的平面上的投影向量, 由于由于b1 b2, 故故c3等于等于a3分别在分别在b1, b2上的投影向量上的投影向量c31及及c32之和之和, 即即32313ccc ,|,|,2222312113bbbabbba 18 定理定理: A为正交矩阵的充要条件是为正交矩阵的充要条件是A的列向量都是的列向量都是单位向量且两两正交单位向量且两两正交. 若若n阶方阵阶方阵A满足满足ATA = E, 即即A-1=AT, 则称则称A为为正交正交矩阵矩阵.证明证明: 由于由于Eaaaaaaaaaaaaaaaaaannnnnnnnnnnn 212222111211212221212111ATA = E EnTn
17、TT ,212119 ., 2, 1,01njijijiijjTi EnTnTnTnnTTTnTTT 212221212111性质性质1 1: 正交变换保持向量的长度不变正交变换保持向量的长度不变.|xxxPxPxyyyTTTT 定义定义: 若若P为正交阵为正交阵, 则线性变换则线性变换 y = Px 称为正交称为正交变换变换.证明证明: 设设线性变换线性变换 y = Px为正交变换为正交变换.则有则有 性质性质2: 设设A为正交矩阵为正交矩阵, 则则A-1=AT也为正交矩阵也为正交矩阵, 且且|A|=1或或1. 性质性质3: 设设A,B都是正交矩阵都是正交矩阵, 则则AB也为正交矩阵也为正交
18、矩阵.20例例6: 判别下列矩阵是否为正交阵判别下列矩阵是否为正交阵. ,1213121121312111 .9794949491989498912 解解(1): 考察矩阵的第一列和第二列考察矩阵的第一列和第二列. , 021311)21()21(1 所以所以(1)不是正交矩阵不是正交矩阵.由于由于解解(2): 注意到注意到, 该矩阵为对称矩阵该矩阵为对称矩阵, 则有则有 100010001T 74441848191 74441848191所以所以(2)是正交矩阵是正交矩阵.21例例6: 验证矩阵验证矩阵 2121000021212121212121212121P 解解: P 的每个列的每个列
19、(行行)向量都是单位向量向量都是单位向量, 且两两正且两两正交交, 所以所以P是正交矩阵是正交矩阵.是正交矩阵是正交矩阵.22 1. 将一组基规范正交化的方法将一组基规范正交化的方法: 先用施密特正交化方法将基正交化先用施密特正交化方法将基正交化, 然后再将其然后再将其单位化单位化.2. A为正交矩阵的充要条件是下列条件之一成立为正交矩阵的充要条件是下列条件之一成立:(1) A-1=AT;(2) ATA=E;(3) A的的列列向量是两两正交的单位向量向量是两两正交的单位向量;(4) A的的行行向量是两两正交的单位向量向量是两两正交的单位向量.235.2 方阵的特征值与特征向量方阵的特征值与特征
20、向量 定义定义: 设设A是是n阶方阵阶方阵, 如果数如果数 和和n维维非零列向量非零列向量x使关系式使关系式Ax = x成立成立, 那末这样的数那末这样的数 称为方阵称为方阵A的的特征值特征值, 非零向量非零向量x称为称为A的对应于特征值的对应于特征值 的的特征向量特征向量.说明说明1: 特征向量特征向量x 0, 特征值问题是对方阵而言的特征值问题是对方阵而言的; 说明说明2: n阶方阵阶方阵A的特征值的特征值, 就是使齐次线性方程组就是使齐次线性方程组(A E)x = 0 有非零解的值有非零解的值 , 即满足方程即满足方程| A E | = 0 的的 都都是矩阵是矩阵A的特征值的特征值.24
21、0212222111211 nnnnnnaaaaaaaaa说明说明3: 方程方程| A E | = 0 称以称以 为未知数的一元为未知数的一元n次方程次方程| A E | = 0为方阵为方阵A的的特征方程特征方程. 记记f( ) = | A E |, 它是它是 的的n次多项式次多项式, 称其为方阵称其为方阵A的的特征多项式特征多项式. n次代数方程有次代数方程有n个根个根(复根和实根复根和实根, 重根按重数重根按重数计算计算).说明说明4: 设设n阶方阵阶方阵A=(aij)的特征值为的特征值为 1, 2, , n, 则有则有: (1) 1 + 2 + + n = a11 + a22 + + a
22、nn; (2) 1 2 n = | A |.25 3113例例1: 求求 3113的特征值和特征向量的特征值和特征向量.解解: A A的特征多项式为的特征多项式为:= (3 )2 1所以所以, 该该方阵方阵A的特征值为的特征值为: 1 = 2, 2 = 4. ,0023112321 xx当当 1 = 2 时时, 对应的特征向量应满足对应的特征向量应满足: 002121xxxx,11 即即解得解得 x1=x2, 故特征值故特征值 1=2对应的特征向量为对应的特征向量为: x=c,0043114321 xx当当 1 = 4 时时, 对应的特征向量应满足对应的特征向量应满足:= 8 6 + 2 =
23、(4 )(2 )(c 0).26 002121xxxx,11 即即解得解得x1=-x2, 故特征值故特征值 2=4对应的特征向量为对应的特征向量为: x=c 由于特征方程由于特征方程| A E | = 0, 故齐次方程故齐次方程组组(A E)x = 0 有非零解有非零解. 因此因此, 求出特征值求出特征值 i 对应的基础解系即可对应的基础解系即可求出求出所有所有特征向量特征向量. 201034011例例2: 求矩阵求矩阵A = =的特征值和特征向量的特征值和特征向量.解解: 矩阵矩阵A的特征多项式为的特征多项式为: 201034011| A E | = (2 )(1 )2,所以所以A的特征值为
24、的特征值为: 1=2, 2= 3=1.(c 0).27当当 1=2时时, 解方程组解方程组( A2E )x = 0.由由,0000100010010140132 EA.1001 p得基础解系得基础解系当当 2= 3=1时时, 解方程组解方程组( AE )x = 0.由由,000210101101024012 EA故对应特征值故对应特征值 1=2的所有特征向量为的所有特征向量为 kp1 (k 0).1212 p得基础解系得基础解系故对应特征值故对应特征值 2= 3=1的所有特征向量为的所有特征向量为kp2(k 0).28 314020112 314020112例例3: 求矩阵求矩阵A = =的特
25、征值和特征向量的特征值和特征向量.解解: 矩阵矩阵A的特征多项式为的特征多项式为:| A E | = (1+ )(2 )2,所以所以A的特征值为的特征值为: 1=1, 2= 3=2.当当 1=1时时, 解方程组解方程组( A+E )x = 0.由由,000010101414030111 EA.1011 p得基础解系得基础解系故对应特征值故对应特征值 1=1的所有特征向量为的所有特征向量为kp1(k 0).29,0000001141140001142 EA,401,11032 pp当当 2= 3=2时时, 解方程组解方程组( A2E )x = 0.由由得基础解系得基础解系故对应特征值故对应特征值
26、 2= 3=2的所有特征向量为的所有特征向量为k2 p2 + k3 p3 (k2, k3不同时为零不同时为零).例例4: 证明证明: 若若 是矩阵是矩阵A的特征值的特征值, 则则(1) m是矩阵是矩阵Am的特征值的特征值(m为正整数为正整数);(2) 当当A可逆时可逆时, 则则 -1是逆阵是逆阵A-1的特征值的特征值. 证明证明(1): 由于由于 是矩阵是矩阵A的特征值的特征值, 设设x是是A的对应的对应特征值特征值 的特征向量的特征向量, 则则 Ax= x.30所以所以, A2x = A(Ax) = A( x) = (Ax) = 2x.即即, 2是矩阵是矩阵A2的特征值的特征值.依此递推得依
27、此递推得, m是矩阵是矩阵Am的特征值的特征值(m为正整数为正整数). 由此我们还证明了由此我们还证明了: 若若x是是A的属于特征值的属于特征值 的特的特征向量征向量, 则则x也是矩阵也是矩阵Am的属于特征值的属于特征值 m的特征向量的特征向量. 证明证明(2): 当当A可逆时可逆时, 则则 0,则由则由 Ax= x 可得可得,x = A-1(Ax) = A-1( x) = (A-1x).所以所以, A-1x = -1x 由此我们还证明了由此我们还证明了: 若若x是是A的属于特征值的属于特征值 的特的特征向量征向量, 则则x也是矩阵也是矩阵A-1的属于特征值的属于特征值 -1的特征向量的特征向
28、量. 还可以类推还可以类推: 若若 是矩阵是矩阵A的特征值的特征值, 则则 ( )是是矩阵矩阵多项式多项式 (A)的特征值的特征值, 其中其中 ( )=a0+a1 +am m, (A)=a0E+a1A+amAm.31证明证明:设有常数设有常数x1, x2, , xm, 使使则在上式左乘则在上式左乘A得得,即即类推之类推之, 有有. 0222111 mmkmkkpxpxpx 定理定理2: 设设p1, p2, , pm是方阵是方阵A的分别对应于的分别对应于m个个互不相等的特征值互不相等的特征值 1, 2, , m的的m个特征向量个特征向量, 则则p1, p2, , pm线性无关线性无关.x1p1
29、+ x2p2 + + xmpm = 0,A(x1p1 + x2p2 + + xmpm)= 0, 1x1p1 + 2x2p2 + + mxmpm = 0,(0)(1)(k)(k=0, 1, 2, , m1)把上面把上面m个向量方程合写成矩阵形式个向量方程合写成矩阵形式, 得得32 1122111111mmmmm 上式等号左端第二个矩阵的行列式为上式等号左端第二个矩阵的行列式为范德蒙范德蒙行列行列式式, 当当 1, 2, , m各不相等时各不相等时, 该行列式不等于该行列式不等于0, 从从而该矩阵可逆而该矩阵可逆. ( x1p1, x2p2, , xmpm ) = (0, 0, ,0)于是有于是有
30、= (0, 0, ,0)即即 xj pj = 0 (j=1, 2, , m). 但但 pj 0 (j=0, 1, 2, , m).( x1p1, x2p2, , xmpm )故故 xj = 0 (j=1, 2, , m).所以所以, 向量组向量组p1, p2, , pm线性无关线性无关. 注注1: 属于不同特征值的特征向量是线性无关的属于不同特征值的特征向量是线性无关的; 注注2: 属于属于同一特征值同一特征值的特征向量的非零线性组合的特征向量的非零线性组合仍是属于这个特征值的特征向量仍是属于这个特征值的特征向量;33 注意注意3: 矩阵的特征向量总是矩阵的特征向量总是相对于矩阵的特征值相对于
31、矩阵的特征值而言的而言的, 一个特征值具有的特征向量不唯一一个特征值具有的特征向量不唯一, 但一个特但一个特征向量不能属于不同的特征值征向量不能属于不同的特征值. 因为因为, 假设向量假设向量x同时是同时是A的属于不同的特征值的属于不同的特征值 1, 2 ( 1 2)的特征向量的特征向量, 即有即有Ax = 1x, Ax = 2x,则有则有, 1x = 2x. 即即( 1 2 ) x = 0. 由由于于( 1 2 ) 0,则则 x = 0,这与这与x是特征向量是特征向量矛盾矛盾. .例例5: 设设n阶方阵阶方阵A的特征多项式为的特征多项式为,|)(0111aaaEAfnnnA 解解:|)(EA
32、fTAT |)( |TTEA |EA 求求AT的特征多项式的特征多项式.,)(0111aaafnnnA 34 求矩阵特征值与特征向量的步骤:求矩阵特征值与特征向量的步骤: 1.计算计算A的特征多项式的特征多项式| A E | ; 2. 求特征方程求特征方程| A E | = 0的全部根的全部根 1, 2, , n, 也也就是就是A的全部特征值的全部特征值; 3. 对于特征值对于特征值 I , 求齐次方程组求齐次方程组(A iE )x = 0 的非的非零解零解, 也就是对应于也就是对应于 i 的特征向量的特征向量.355.3 相似矩阵相似矩阵 定义定义: 设设A, B都是都是n阶矩阵阶矩阵, 若
33、有若有可逆可逆矩阵矩阵P, 使使P-1AP = B ,则称则称B是是A的相似矩阵的相似矩阵, 或说或说矩阵矩阵A与与B相似相似, 对对A进行进行运算运算P-1AP, 称为称为对对A进行相似变换进行相似变换, 可逆矩阵可逆矩阵P称为把称为把A变成变成B的的相似变换矩阵相似变换矩阵. 定理定理3: 若若n阶阶矩阵矩阵A与与B相似相似, 则则A与与B的特征多项的特征多项式相同式相同, 从而从而A与与B的特征值亦相同的特征值亦相同.证明证明: 由于矩阵由于矩阵A与与B相似相似, 则存在可逆矩阵则存在可逆矩阵P, 使使P-1AP = B| B E | = | P-1AP E | = | P-1AP P-
34、1EP | 所以所以,= | P-1(A E)P |= | A E |= | P-1| | A E | | P |36相似矩阵的性质相似矩阵的性质:1. 相似矩阵是等价的相似矩阵是等价的:(1) 自反性自反性: A与与A本身相似本身相似;(2) 对称性对称性: 若若A与与B相似相似, 则则B与与A相似相似;(3) 传递性传递性: 若若A与与B相似相似, B与与C相似相似, 则则A与与C相似相似.21 n = diag( 1, 2, n ) =其中其中 若若n阶方阵阶方阵A与对角阵与对角阵 =diag( 1, 2, n )相似相似, 则称则称方阵方阵A可可(相似相似)对角化对角化. 推论推论:
35、若若n阶方阵阶方阵A与对角阵与对角阵 =diag( 1, 2, n )相似相似, 则则 1, 2, n 即是即是A的的n个个特征值特征值.373. P-1(A1A2)P = (P-1A1P)(P-1A2P).4. 若若A与与B相似相似, 则则Am与与Bm相似相似(m为正整数为正整数) ).2. P-1(k1A1+k2A2)P = k1P-1A1P+k2P-1A2P.其中其中k1, k2是任意常数是任意常数由于矩阵由于矩阵A与与B相似相似, 则存在可逆矩阵则存在可逆矩阵P, 使使P-1AP = B, 亦即亦即 A = PBP-1, 所以所以, Am = (PBP-1)m = PBP-1PBP-1
36、 PBP-1= PBmP-1.进一步有进一步有, 若若 (A)=a0E+a1A+amAm, 则则 (A)=a0PP-1+a1PBP-1+amPBmP-1 =P(a0E+a1B+amBm)P-1=P (B)P-1.即即相似矩阵的多项式相似矩阵的多项式, 有相同的相似变换矩阵有相同的相似变换矩阵.Am = P mP-1; (A)= P ( )P-1.特别当矩阵特别当矩阵A与对角阵与对角阵 =diag( 1, 2, n )相似时相似时,则则38;21 knkk 而对于对角阵而对于对角阵 , 有有 k = ( )=.)()()(21 n 利用上述结论可以很方便地计算矩阵利用上述结论可以很方便地计算矩阵
37、A的多项的多项 (A). 结论结论: 若若f( )为矩阵为矩阵A的特征多项式的特征多项式, 则矩阵则矩阵A的多的多项式项式f(A)=O. 此结论的一般性证明较困难此结论的一般性证明较困难, 但当矩阵但当矩阵A与对角与对角阵阵 相似时很容易证明相似时很容易证明. 即即121)()()( PPnfff =POP-1=O. f(A)=Pf( )P-1=39 n阶方阵阶方阵A是否与对角阵是否与对角阵 =diag( 1, 2, n )相似相似, 则我们需要解决如下两个问题则我们需要解决如下两个问题: 1. 方阵方阵A满足什么条件与对角阵满足什么条件与对角阵 相似相似; 2. 如何求相似变换矩阵如何求相似
38、变换矩阵P. 以下定理及其证明过程回答了以上两个问题以下定理及其证明过程回答了以上两个问题. 定理定理4: n阶矩阵阶矩阵A与对角矩阵与对角矩阵 相似相似(即即A能对角化能对角化)的充分必要条件是的充分必要条件是A有有n个线性无关的特征向量个线性无关的特征向量.证明证明: 假设存在假设存在可逆阵可逆阵P, 使使P-1AP = 为对角阵为对角阵, 把把P用其列向量表示为用其列向量表示为P=( p1, p2, , pn ).由由P-1AP = , 得得AP = P ,40 n 21A( p1, p2, , pn ) = ( p1, p2, , pn )( Ap1, Ap2, , Apn ) = (
39、 1 p1, 2 p2, , n pn ),即即因而有因而有,Api = i pi ( i =1, 2, , n ). 可见可见, i 是是A的特征值的特征值, 而而P 的列向量的列向量pi 就是就是A对应对应于特征值于特征值 i 的特征向量的特征向量.再由再由P的可逆性知的可逆性知, p1, p2, , pn线性无关线性无关. 反之反之, 由于由于A恰好恰好有有n个特征值个特征值 1, 2, , n, 并可并可对应地求得对应地求得n个个线性无关的线性无关的特征向量特征向量p1, p2, , pn, 这这n个特征向量即可构成个特征向量即可构成可逆可逆矩阵矩阵P = ( p1, p2, , pn
40、 ), 使使AP = ( Ap1, Ap2, , Apn )= ( 1 p1, 2 p2, , n pn )即即41= P . n 21= ( p1, p2, , pn )因此有因此有, P-1AP = , 即即矩阵矩阵A与对角矩阵与对角矩阵 相似相似.命题得证命题得证. 推论推论: 如果如果n阶矩阵阶矩阵A有有n个互不相等的特征值个互不相等的特征值, 则则A与对角阵相似与对角阵相似. 说明说明: 如果如果A的特征方程有重根的特征方程有重根, 此时不一定有此时不一定有n个线性无关的特征向量个线性无关的特征向量, 从而矩阵从而矩阵A不一定能对角化不一定能对角化. 但如果能找到但如果能找到n个线性
41、无关的特征向量个线性无关的特征向量, 则则A还是能对还是能对角化角化.42例例1: 判断下列实矩阵能否化为对角阵判断下列实矩阵能否化为对角阵:,242422221 A.201335212 B解解: 242422221| A E | =( 2)2( +7) = 0 得得A的特征值的特征值: 1= 2=2, 3=7.将将 1= 2=2代入代入( A E )x = 0, 得得,04420442022321321321 xxxxxxxxx解之得基础解系解之得基础解系:.110,10221 pp43将将 3=7代入代入( A E )x = 0, 得得,054204520226321321321 xxxx
42、xxxxx解之得基础解系解之得基础解系:.2213 pA有有3个线性无关的特征向量个线性无关的特征向量, 因而因而A可对角化可对角化. 201335212| B E | = ( +1)3 = 0 得得B的特征值的特征值: 1= 2= 3=1.将将 1= 2 = 3=1 代入代入( B E )x = 0, 得得44故故B不能对角化不能对角化.,01032502331321321 xxxxxxxx解之得基础解系解之得基础解系:.111 p,163053064 角角化化, 求出可逆矩阵求出可逆矩阵P, 使使P-1AP = 为对角阵为对角阵. 例例2: 设设A=A能否对角化能否对角化? 若能对若能对解
43、解: 163053064| A E | = ( 1)2( +2) = 0 得得A的特征值的特征值: 1= 2=1, 3=2.45将将 1= 2=1代入代入( A E )x = 0, 得得,063063063212121 xxxxxx解之得基础解系解之得基础解系:.100,01221 pp将将 3=2代入代入( A E )x = 0, 得得,03630330663212121 xxxxxxx解之得基础解系解之得基础解系:.1113 p46 ,110101102,321 pppP.2000100011 APP令令则有则有注意注意: 若令若令 ,101011021,213 pppP.112-1 AP
44、P矩阵矩阵P的列向量和对角矩阵中特征值的位置要相的列向量和对角矩阵中特征值的位置要相互对应互对应.则有则有471. 相似矩阵相似矩阵 相似是矩阵之间的一种关系相似是矩阵之间的一种关系, 它具有很多良好的它具有很多良好的性质性质, 除了课堂内介绍的以外除了课堂内介绍的以外, 还有还有: (1) 若若A与与B相似相似, 则则det(A)=det(B); (2) 若若A与与B相似相似, f(x)为多项式为多项式, 则则f(A)与与f(B)相似相似; (3) 若若A与与B相似相似, 且且A可逆可逆, 则则B也可逆也可逆, 且且A-1与与B-1相似相似.2. 相似变换与相似变换矩阵相似变换与相似变换矩阵
45、 相似变换相似变换是对是对方阵方阵进行的一种运算进行的一种运算, 它把它把A变成变成P-1AP, 可逆矩阵可逆矩阵P称为进行这一变换的称为进行这一变换的相似变换矩阵相似变换矩阵.48 这种变换的重要意义在于这种变换的重要意义在于简化对矩阵的各种运算简化对矩阵的各种运算,其方法是先通过其方法是先通过相似变换相似变换, 将矩阵变成将矩阵变成对角矩阵对角矩阵, 再对再对对对角矩阵角矩阵进行运算进行运算, 从而将比较复杂的矩阵的运算转从而将比较复杂的矩阵的运算转化为比较简单的化为比较简单的对角矩阵对角矩阵的运算的运算.495.4 实对称矩阵的对角化实对称矩阵的对角化 定理定理5: 实对称矩阵的特征值为
46、实数实对称矩阵的特征值为实数.xAxA .xxAx 说明说明: 本节所提到的本节所提到的对称矩阵对称矩阵, 除非特别说明除非特别说明, 均均指指实对称矩阵实对称矩阵.用用 表示表示 的的共轭复数共轭复数, 用用 表示表示x的的共轭复向量共轭复向量. x 证明证明: 设向量设向量x (x 0)为为实实对称矩阵对称矩阵A的对应复特的对应复特征值征值 的特征向量的特征向量, 即即Ax = x,于是有于是有)(AxxAxxTT )( xxT )(xxT xAxAxxTTT)( xxAT)( xxT)( )(xxT 及及50两式相减两式相减, 得得. 0)( xxT , 0|121 niiniiiTxx
47、xxx但因为但因为x 0, 所以所以, 即即由此可得由此可得, 是实数是实数., 0)( 则则 定理定理5的意义的意义: 由于实对称矩阵由于实对称矩阵A的特征值的特征值 i 为实为实数数, 所以齐次线性方程组所以齐次线性方程组( A iE ) x = 0是实系数方程组是实系数方程组, 由由| A i E | = 0 知知, 必有实的基础解系必有实的基础解系,从而对应的特征向量可以取实向量从而对应的特征向量可以取实向量. 定理定理6: 设设 1, 2是对称矩阵是对称矩阵A的两个特征值的两个特征值, p1, p2是对应的特征向量是对应的特征向量, 若若 1 2, 则则p1与与p2正交正交.证明证明
48、: 由条件知由条件知, Api = i pi ( i =1, 2), A = AT.所以所以, 1 p1T = ( 1 p1)T = (Ap1)T = p1TAT = p1TA,51 1 p1Tp2 = ( 1 p1T) p2于是于是= p1T(Ap2)= (p1TA) p2= p1T( 2 p2) = 2 p1Tp2,则则( 1 2 ) p1Tp2 = 0.再由再由 1 2 得得, p1Tp2 = p1, p2 = 0, 即即 p1与与p2 正交正交. 定理定理7: 设设A为为n阶对称矩阵阶对称矩阵, 是是A的特征方程的的特征方程的r 重根重根, 则矩阵则矩阵(A E )的秩的秩R(A E
49、) = nr, 从而对应从而对应 r重重特征值特征值 恰有恰有r 个线性无关的特征向量个线性无关的特征向量.这个定理的证明超出本课程范围这个定理的证明超出本课程范围, 证明略证明略. 定理定理8: 设设A为为n阶对称矩阵阶对称矩阵, 则必有则必有正交矩阵正交矩阵P , 使使P-1AP = , 其中其中 是以是以A的的n个特征值为对角元素的对个特征值为对角元素的对角矩阵角矩阵. 证明证明: 设设A的互不相等的特征值为的互不相等的特征值为 1, 2 , , s , 它它们的重数依次为们的重数依次为r1, r2 , , rs , 且且r1 + r2 + + rs = n .52 根据定理根据定理5和
50、定理和定理7可得可得: 对应特征值对应特征值 i ( i =1, 2, , s), 恰有恰有ri 个线性无关的实个线性无关的实特征向量特征向量. 把它们正交化把它们正交化, 单位化单位化, 即得即得ri个单位正交的个单位正交的特征向量特征向量.这样的特征向量共可得这样的特征向量共可得n个个.由于由于r1+r2+rs = n, 由定理由定理6知知, 对应于不同特征值的特征向量正交对应于不同特征值的特征向量正交,故这故这n个单位特征向量两两正交个单位特征向量两两正交.以它们为列向量构成正交矩阵以它们为列向量构成正交矩阵P, 则则P-1AP = ,其中对角矩阵其中对角矩阵 的对角元素含的对角元素含r