1、第十一章第十一章 多元回归与相关多元回归与相关 多元线性回归多元线性回归多元相关与偏相关多元相关与偏相关 一元回归是依变量一元回归是依变量y在一个自变量在一个自变量x上的回归,它仅仅涉及到两个变量的关上的回归,它仅仅涉及到两个变量的关系问题。但在许多实际问题中,影响依系问题。但在许多实际问题中,影响依变量的因素常常不止一个。因此,为了变量的因素常常不止一个。因此,为了研究依变量研究依变量y与多个自变量与多个自变量x之间的关系,之间的关系,必须在一元回归的基础上做相应的补充,必须在一元回归的基础上做相应的补充,进一步研究多元回归的问题。进一步研究多元回归的问题。多元回归与相关分析主要解决的问题:
2、多元回归与相关分析主要解决的问题:1、建立由多个自变量描述和预测依变量的建立由多个自变量描述和预测依变量的 多元回多元回 归方程归方程。2、在多个自变量中,选择对依变量有显著在多个自变量中,选择对依变量有显著 效应的自变量,剔除不显著的自变量,效应的自变量,剔除不显著的自变量,建立建立最优回归方程最优回归方程。3、计算某个自变量在其它自变量固定不变计算某个自变量在其它自变量固定不变 时对依变量的效应,这个效应称为时对依变量的效应,这个效应称为偏回偏回 归系数归系数。5、计算各个自变量的、计算各个自变量的标准偏回归系数(通径标准偏回归系数(通径 系数)系数),评定各自变量对依变量影响的相,评定各
3、自变量对依变量影响的相 对重要程度。对重要程度。4、计算多个自变量综合起来对依变量的、计算多个自变量综合起来对依变量的多元多元 相关系数相关系数,也可计算两变量间在其它变量,也可计算两变量间在其它变量 保持不变时的保持不变时的偏相关系数偏相关系数。11.1 多元回归方程多元回归方程 多元回归是研究一个依变量在两个或两多元回归是研究一个依变量在两个或两个以上自变量上的回归,也称为个以上自变量上的回归,也称为复回归复回归。在多元线性回归分析中,当其他自变量在多元线性回归分析中,当其他自变量都保持一定数量水平时,各自变量对依变都保持一定数量水平时,各自变量对依变量的效应(影响),称为量的效应(影响)
4、,称为偏回归系数偏回归系数。一、多元线性回归方程一、多元线性回归方程 假定在假定在M个随机变数中,有一个为依变数个随机变数中,有一个为依变数Y,另外另外m个(个(m=M-1)为自变数)为自变数x1,x2,xm,且且m个自变数皆与依变数成线性关系,则其回归方个自变数皆与依变数成线性关系,则其回归方程可表示为:程可表示为:.)1(21)1(12mmmmymbyxxxxb系数,记作的偏回归对都保持不变时,、叫做在mmymmymymmmymmymyxbxbxbaxxbxxbxxbyy)1(1221321231)1(122213211231)()()(其中:mmymmymyxbxbxbya)1(1221
5、321231.1132231byxxxxbmmy记作的偏回归系数,对都保持不变时,、叫做在.2231132byxxxxbmmy记作的偏回归系数,对都保持不变时,、叫做在因此,因此,y对对x1,x2,xm 的多元回的多元回归方程可简写为:归方程可简写为:1112221 12 2()()()mmmm myy b xxb xxb xxa bxbxb x 二、正规方程组的解及其实例二、正规方程组的解及其实例 要使多元回归方程能够最好地代表要使多元回归方程能够最好地代表y与与x1、x2、xm 在数量上的互变关系,根在数量上的互变关系,根据最小平方法原理,应使据最小平方法原理,应使2121112221()
6、()()()nnmmmQyyyyb xxb xxbxx最小最小则有,令nmmmmmXbXbXbYQxxXxxXxxXyyY122211222111)(YXXbXXbXXbYXXXbXbXXbYXXXbXXbXbmmmmmmmmm222112222221111212121 根据求极值的原理,分别对根据求极值的原理,分别对b1,b2,bm求偏导,求偏导,并令之为并令之为0,即可整理得,即可整理得m元线性回归方程的正规方程组元线性回归方程的正规方程组:2221122121211221122,.;,.,.;,.,mmmmmmyymymSSXSSXSSXSPX XSPX XSPX XSPX Y SPX
7、YSPX Y由于可得如下方程组:mymmmmymmymmSPSSbSPbSPbSPSPbSSbSPbSPSPbSPbSSb22112222121111221111112121222212ymymmmmmmySPbSSSPSPSPSPSSSPbSPSPSSbSP这个正规方程组可用矩阵(matrix)表示为 A b K Ab=K b=A-1K若要求解若要求解b,则需先求出系数矩阵则需先求出系数矩阵A的逆矩阵的逆矩阵A-1 ,AA-1=I1112121222112mmijmmmmc ccc ccAcccc假 定11,100010001ijjiccAAA AIIIA1m上式中,是阶的对称矩阵,既有由于
8、是 的逆矩阵,故有:其中 为单位矩阵,即:111111121222122212,ymymmymmmmmAbA KSPbcccSPbcccSPbccc两边同乘以可得:即:【例例11.1】测得小麦每株穗数(测得小麦每株穗数(x1)、每)、每穗粒数(穗粒数(x2)、千粒重()、千粒重(x3,)和单株产量)和单株产量(y,克)如下表,试建立其多元回归方程。,克)如下表,试建立其多元回归方程。样样 本本 x1 x2 x3 y 1 10.5 33.2 36.3 14.7 2 9.2 30.1 36.2 13.5 3 10.7 32.6 37.7 16.5 4 13.9 31.8 37.2 21.5 5 1
9、0.2 32.4 36.4 14.5 6 10.8 33.1 35.0 15.9 7 8.1 33.5 33.4 7.6 8 10.6 34.6 34.5 16.0 9 10.1 30.7 34.1 12.7 10 10.4 31.6 34.9 12.4 11 10.7 33.8 39.2 19.3 12 8.4 31.4 35.1 9.2 13 6.3 33.5 32.0 6.4 14 8.2 31.9 37.2 10.6 15 9.8 32.4 36.5 11.3 2112222332121323123147.9,1499.43486.6,15806.1535.7,19178.59202.
10、1,2962.854796.71,5306.1717375.31,2083.736561.89,7291.1815xxxxxxyyx xx xx xx yx yx yn解:根据表中的资料算得解:根据表中的资料算得14个一级数据:个一级数据:由一级数据算得由一级数据算得14个二级数据个二级数据:1231231213231239.86,32.44,35.7113.47,41.14,20.8046.96,239.89,1.1724.17,2.80,91.025.77,73.52yyyyxxxyssssssssspspspspspsp 于是得正规方程组于是得正规方程组52.7396.4680.217.
11、2477.580.280.2017.102.9117.2417.114.41321321321bbbbbbbbb上述方程组的系数矩阵上述方程组的系数矩阵A、常数项矩阵、常数项矩阵K、未知数未知数矩阵矩阵b分别分别为:为:12341.41.1724.171.1720.802.8024.172.8046.9691.025.7773.52AKbbbb 111213112132122231222331323313233100010001cccSSSPSPcccSPSSSPcccSPSPSS1.A 0 0348470 00045790 0179630 00045790 0484720 00312580
12、0179630 00312580 0307266123.bbbb 0 0348470 00045790 01796391 021 84850 00045790 0484720 00312585 770 46780 0179630 00312580 030726673 520 64218610.4271.356421.044.324678.086.98485.147.13332211axbxbxbya得根据3213216421.04678.08485.18610.42xxxyxxxy:的三元线性回归方程为、依故所求 此方程的意义为:此方程的意义为:当穗粒数当穗粒数x2和千粒重和千粒重x3保持不变
13、时,每株穗保持不变时,每株穗数数x1每增加每增加1个,则单株产量增加个,则单株产量增加1.8485g;当每株穗数当每株穗数x1和千粒重和千粒重x3保持不变时,穗粒保持不变时,穗粒数数x2每增加每增加1粒,单株产量增加粒,单株产量增加0.4678g;当每株穗数当每株穗数x1和穗粒数和穗粒数x2保持不变时,千粒保持不变时,千粒重重x3每增加每增加1g,单株产量增加,单株产量增加0.6421g。根据以上回归方程,就可以估计根据以上回归方程,就可以估计 的值。的值。如当第一个样本的观测值如当第一个样本的观测值x1=10.5,x2=33.2,x3=36.3时,时,y的估计值为:的估计值为:)(39.15
14、3.366421.02.334678.05.108485.18610.42克y 而而y的实际观察值为的实际观察值为14.7克,二者的差值即为克,二者的差值即为离回归部分。离回归部分。y 离回归的存在,有以下可能原因离回归的存在,有以下可能原因:1、除除x1、x2、x3三个变量外,还有其它变量三个变量外,还有其它变量 对对y 产产 生作用;生作用;2、有随机误差的影响;、有随机误差的影响;注意:注意:在利用回归方程进行预测时,应限定自在利用回归方程进行预测时,应限定自变量的范围:变量的范围:x1的区间的区间6.3,13.9,x2的区间的区间30.1,34.6,x3的区间的区间32.0,39.0,
15、不可随,不可随意外延。如果扩展预测范围,需补充观测资料,重意外延。如果扩展预测范围,需补充观测资料,重新建立回归方程新建立回归方程。既然应用多元回归方程进行回归估既然应用多元回归方程进行回归估计时,实际值与估计值有偏差,因此,计时,实际值与估计值有偏差,因此,当建立起一个多元线性回归方程之后,当建立起一个多元线性回归方程之后,应了解它的的估计标准误。应了解它的的估计标准误。三、多元线性回归方程的估计标准误三、多元线性回归方程的估计标准误 多元线性回归方程的建立只是保证了离回归平多元线性回归方程的建立只是保证了离回归平方和最小,但在给定的方和最小,但在给定的x1、x2、xm下,多元下,多元回归方
16、程的点估计值和实测值仍然是有差异的。回归方程的点估计值和实测值仍然是有差异的。度度量这种差异大小的统计量就是回归方程的估计标准量这种差异大小的统计量就是回归方程的估计标准误。误。其计算公式如下其计算公式如下:12/12(1)ymymQsnm/12/1222/12/12/122/121122()();()ymymymyymymymyymmysQQyyyySSUmUmUyybSPb SPb SP其中:称为多元回归方程的估计标准误或离回归标准误;称为多元离回归平方和,且为自变量的个数为 元回归平方和;【例例11.2】试计算表试计算表11.1资料三元线性回归方程资料三元线性回归方程 =-42.8610
17、+1.8485x1+0.4678x2+0.6421x3的的估计标准误。估计标准误。在在例例11.1中已算出中已算出SSy=239.89,SP1y=91.02,SP2y=5.77,SP3y=73.52由由式式(11.10)得得 Uy123=b1SP1y+b2SP2y+bmSPmy =1.848591.02+0.46785.77+0.642173.52=218.16由由式式(11.9)得:得:Qy.123=SSy-Uy.12m=239.89-218.16=21.73 y/12321.731.4055153 1yS 这个这个1.4055g就是由表就是由表11.1所建所建立的三元回归方程的估计标准误。
18、立的三元回归方程的估计标准误。再由式再由式(11.8)得:得:四、多元线性回归的假设测验四、多元线性回归的假设测验(一)多元回归关系的假设测验(一)多元回归关系的假设测验 在多元回归分析中,可将依变量的总变异分解在多元回归分析中,可将依变量的总变异分解为为多元回归和离回归多元回归和离回归两个部分,各项变异来源的平两个部分,各项变异来源的平方和、自由度见下表。方和、自由度见下表。多元线性回归的方差分析表多元线性回归的方差分析表变异原变异原因因DFSSMSF多元回多元回归归mUy/12mMS回回MS回回/MS离离离回归离回归n-m-1Qy/12mMS离离总和总和n-1SSy令令b1,b2,bm所代
19、表的总体回归系数为所代表的总体回归系数为 1、2、m,则有,则有H0:1=2=m=0HA:1、2、m不全等于零。不全等于零。如果如果F F0.05,(m,n-m-1),称该回归在称该回归在0.05 水平上显著;水平上显著;如果如果F F0.01,(m,n-m-1),则称该回归在则称该回归在0.01水平上显著水平上显著;如果如果F F0.05,(m,n-m-1),称该回归不显著称该回归不显著。【例例11.3】试对例试对例11.1资料做多元回归关系的假资料做多元回归关系的假设测验。设测验。解:由例解:由例11.1已已算得算得Uy/123=218.16,Qy/123=21.73,SSy=239.89
20、 和和 n=15。变异原因变异原因 DF SS MS F F0.01三元回归三元回归 3 218.16 72.72 36.72 6.22离回归离回归 11 21.73 1.98 总和总和 14 239.89 表表11.3 表表11.1资料三元回归的假设测验资料三元回归的假设测验F=36.72F0.01=6.22,为极显著,为极显著,故否定故否定H0:1=2=3=0,推断小麦单株产量依每株穗数、穗粒推断小麦单株产量依每株穗数、穗粒数和千粒重的三元线性回归为极显著。数和千粒重的三元线性回归为极显著。注意:注意:1、多元线性回归显著并不排除有多元非、多元线性回归显著并不排除有多元非线性回归关系的存在
21、;线性回归关系的存在;2、多元线性回归显著,并不排除其中存、多元线性回归显著,并不排除其中存在着与在着与y无线性回归关系的自变量的可能性。无线性回归关系的自变量的可能性。正如方差分析中正如方差分析中F F测验显著,并不代表所测验显著,并不代表所有处理平均数的差异都显著。有处理平均数的差异都显著。多元线性回归关系的假设测验实质上是测多元线性回归关系的假设测验实质上是测定各个自变量对定各个自变量对y的综合作用是否有真实的回归的综合作用是否有真实的回归关系。关系。如果某些自变量和如果某些自变量和y有极显著的回归关系,有极显著的回归关系,而另一些自变量和而另一些自变量和 y没有回归关系,在测验综合没有
22、回归关系,在测验综合作用时往往不能予以区分。作用时往往不能予以区分。因此,要评定各个自变量对因此,要评定各个自变量对y是否有真实的是否有真实的回归关系必须对各个偏回归系数做假设测验。回归关系必须对各个偏回归系数做假设测验。(二)偏回归系数的假设测验(二)偏回归系数的假设测验 偏回归系数假设测验就是测验各个偏回偏回归系数假设测验就是测验各个偏回归系数归系数bibi是否来自是否来自i=0i=0的总体。的总体。H H0 0:i=0 i=0 ;H HA A:i0i0。可用可用t t测验或测验或F F测验进行。测验进行。1、t测验测验 偏回归系数偏回归系数bi的标准误为的标准误为 iimybcssi12
23、 由于由于 服从服从df=n-m-1的的t分布,故在分布,故在H0:i=0 的假设下,可由的假设下,可由 测定测定bi是否抽自是否抽自i=0 的总体的总体。biiiSbbiiSbt 【例例11.4】试对例试对例11.1资料的资料的b1=1.8485,b2=0.4678,b3=0.6421做做t测验。测验。在例在例11.2已算得已算得 sy/123=1.4055,c11=0.034847,c22=0.048472,c33=0.0307266/123biyiiSSC61.22624.06421.02464.00307266.04055.151.13094.04678.03094.0048472.0
24、4055.104.72624.08485.12624.0034847.04055.1321tStStSbbb查附表查附表3,得,得t0.05,11=2.201,t0.01,11=3.106,b1的的t=7.04t0.01,11为极显著;为极显著;b2的的t=1.51t0.05,11为显著。为显著。即每株穗数(即每株穗数(x1)和千粒重()和千粒重(x3)对产量)对产量皆有显著的回归关系。皆有显著的回归关系。对于对于b2应接受应接受H0,否定,否定HA,即每穗粒数,即每穗粒数对产量没有真实的回归关系。对产量没有真实的回归关系。2、F测验测验 在在 多元回归中,多元回归中,Uy12m总是随着总是随
25、着m的增多而增大,如果取消一个自变量的增多而增大,如果取消一个自变量xi,则则Uy12m-1要比要比Uy12m减少减少Upi.iiipcbUi2 Upi就是就是y在在xi上的偏回归平方和上的偏回归平方和,也就是由也就是由xi的变异所产生的回归部分的变异所产生的回归部分平方和,具有平方和,具有1个自由度。因此,由个自由度。因此,由/12(1)ipymUFQnm可测定可测定bi是否来自是否来自i=0的总体。的总体。【例例11.5】试对例试对例11.1资料的资料的b1=1.8485,b2=0.4678,b3=0.6421做做F测验。测验。由由以上计算结果可算得以上计算结果可算得 y对对x1的偏回归平
26、方和为的偏回归平方和为 Up1=b12/c11=1.84852/0.034847=98.06 y对对x2的偏回归平方和为的偏回归平方和为 Up2=b22/c22=0.46782/0.048472=4.51 y对对x3的偏回归方和为的偏回归方和为 Up3=b32/c33=0.64212/0.0307266=13.42 表表11.4 例例11.1资料偏回归系数的假设测验资料偏回归系数的假设测验 变异来源DFSSMSFF0.05F0.01因 x 1 的 偏回归198.0698.0649.53*4.849.65因 x 2 的 偏回归14.514.512.28 因 x 3 的 偏回归113.4213.4
27、26.78*离 回 归1121.731.98 这里有一个问题值得引起注意这里有一个问题值得引起注意:表表11.3中中y因因x1、x2、x3的三元回归平方和的三元回归平方和 Uy/123=218.16 而表而表11.4中中y因因x1、x2、x3的偏回归平方和的偏回归平方和分别为分别为Up1=98.06,Up2=4.51,Up3=13.42,则则Up1+Up2+Up3=115.99 Upi (rij0)Uy/12m Upi (rij0)(三)自变数的重要性和取舍(三)自变数的重要性和取舍 在多元回归中,各个自变量对于在多元回归中,各个自变量对于y的影的影响是不同的。凡是偏回归平方和最小的必然响是不
28、同的。凡是偏回归平方和最小的必然是在这些因素中对是在这些因素中对y作用最小的一个。通常作用最小的一个。通常经过偏回归系数的假设测验后,对于那些不经过偏回归系数的假设测验后,对于那些不显著的自变量可以显著的自变量可以舍去舍去。1.由于自变量间可能存在着相关,不能由于自变量间可能存在着相关,不能一次将所有不显著的自变量全部舍去。一次将所有不显著的自变量全部舍去。2.通常先弃去那个通常先弃去那个Upi最小而又不显著的最小而又不显著的自变量,然后再作分析。自变量,然后再作分析。4.如此重复进行,直至回归方程中所包含如此重复进行,直至回归方程中所包含 的自变量都达显著时为止。这时的多元的自变量都达显著时
29、为止。这时的多元 回归方程称为回归方程称为最优多元回归方程。最优多元回归方程。3.这时,各自变量对这时,各自变量对y的偏回归平方和的偏回归平方和 都都 将有所改变,应对它们重新测验,再弃将有所改变,应对它们重新测验,再弃 去那个去那个Upi最小而又不显著的自变量。最小而又不显著的自变量。【例例11.6】试对表试对表11.1资料的自变量进资料的自变量进行取舍,建立最优多元线性回归方程。行取舍,建立最优多元线性回归方程。由例由例11.4偏回归系数的假设测验知,偏回归系数的假设测验知,x2的偏回归系数的偏回归系数b2不显著,将其从多元回归方不显著,将其从多元回归方程中剔除,作二元回归分析,计算程中剔
30、除,作二元回归分析,计算如下:如下:*,(),(,)ikiikkkikkjijijkkcbbbikccccci jkcb*1=1.8485-(-0.0004579/0.048472)0.4678 =1.8529c*11=0.034847-(-0.0004579)2/0.048472 =0.034843b*3=0.6421-(0.0031258/0.048472)0.4678 =0.6119c*33=0.0307266-(0.0031258)2/0.048472 =0.030525将将b*1,b*3代入式代入式(11.3)得得 a=13.47-1.85299.86-0.611935.71=-26
31、.65二元回归方程为二元回归方程为 =-26.65+1.8529x1+0.6119x3 y 对对b*1,b*3进行显著性检验:进行显著性检验:Uy/13=b*1X1Y+b*3X3Y =1.852991.02+0.611973.52 =213.64 Qy/13=239.89-213.64=26.25/13/1326.251.47912yyQSnm这时因已剔除了一个自变量,故离回归这时因已剔除了一个自变量,故离回归平方和的自由度为平方和的自由度为n-(m-1)-1=n-m。11113330.05,120.01,12131.497.(/)./././.,.,bbbbbsbb0 0348430 276
32、1tbs1 8529 0 27616 71s1 4790 0305250 2584tbs0 6119 0 25842 373t2 179 t3 055对有查附表,为极显著,为显著。因此所建立的二元回归方程因此所建立的二元回归方程 =-26.65+1.8529x1+0.6119x3为为最优回归方程。最优回归方程。y 11.2 多元相关和偏相关多元相关和偏相关 在在M=m+1个变量中,个变量中,m个变量的综个变量的综合与合与1个变量的相关,叫做个变量的相关,叫做多元相关或多元相关或复相关复相关。而在其余。而在其余M-2个变量都固定个变量都固定时时,指定的两个变量间的相关,叫做,指定的两个变量间的相
33、关,叫做偏相关或净相关偏相关或净相关。1、多元相关系数、多元相关系数 y依依x1,x2,xm的多元决定系数的多元决定系数或复决定系数或复决定系数R2y12m定义为定义为:R2y/12m=Uy/12m/SSy 而多元相关系数或复相关系数而多元相关系数或复相关系数Ry12m则定义为则定义为 即多元相关系数为多元回归平方和与总变异即多元相关系数为多元回归平方和与总变异平方和之比的平方根。平方和之比的平方根。/12/12/121ymymymyyUQRSSSS由于由于0Uy.12m SSy,故故Ry/12m的取值区间为的取值区间为0,1。在自由度一定时,在自由度一定时,Ry/12m愈近于愈近于1,复相关
34、愈密切;,复相关愈密切;Ry/12m愈近于愈近于0,愈不密切。,愈不密切。Uy/12m一般总是随一般总是随m的增多而加大。因为的增多而加大。因为多元回归平方和一定大于任一个自变量对多元回归平方和一定大于任一个自变量对y的回归平方和,故多元相关系数一定要的回归平方和,故多元相关系数一定要比任一比任一xi和和y的简单相关系数的绝对值大。的简单相关系数的绝对值大。2、偏相关系数、偏相关系数 在在M个变量中固定个变量中固定M-2个变量,余下的两个变量,余下的两个变量的线性相关系数叫做个变量的线性相关系数叫做偏相关系数或净偏相关系数或净相关系数相关系数。它表示在其他各个变量都保持一定时,它表示在其他各个
35、变量都保持一定时,指定的两个变量间相关的密切程度。指定的两个变量间相关的密切程度。变量在实际上都是不固定的,所变量在实际上都是不固定的,所谓固定是指应用统计方法,消去不固谓固定是指应用统计方法,消去不固定的影响。因此偏相关系数定的影响。因此偏相关系数rij.就是变就是变量量xi和和xj,当它们和其他变量的相关都,当它们和其他变量的相关都消去后的线性相关系数。消去后的线性相关系数。两个变量间的简单相关系数不能两个变量间的简单相关系数不能正确说明这两个变量间的真正关系。正确说明这两个变量间的真正关系。在多个变量错综复杂的关系中,偏相在多个变量错综复杂的关系中,偏相关系数可帮助排除假像相关,找到真关
36、系数可帮助排除假像相关,找到真实关系最为密切的变量。实关系最为密切的变量。表示表示x3,x4,xm变量变量都固定时,都固定时,x1和和x2的偏相的偏相关系数;关系数;表示表示x2,x3,x5,xm变量都固定时,变量都固定时,x1和和x4的偏相关系数。的偏相关系数。r1234mr14.23m 偏相关系数的取值区间和简单相关系数一样,偏相关系数的取值区间和简单相关系数一样,也是也是-1,1,同时,同时rij=rji。若有。若有M个变量则偏相个变量则偏相关系数共有关系数共有M(M-1)/2个。个。关于偏相关系数的计算关于偏相关系数的计算:若仅有若仅有3个变量,可由简单相关系数直接计算。个变量,可由简
37、单相关系数直接计算。设有设有3个变量个变量xi,xj和和xk,则消去,则消去xk对对xi和和xj的影响的影响后,后,xi和和xj的偏相关系数的偏相关系数:)1)(1(22jkikjkikijkijrrrrrr 【例例11.8】试计算表试计算表11.1资料舍去穗粒数资料舍去穗粒数(x2)后,后,单株产量单株产量(y)与每株穗数与每株穗数(x1)和千粒重和千粒重(x3)的的偏相偏相关系数。关系数。1313./(.)./(.)./(.).ijyyrr91 0241 14 239 890 9162r73 5246 96 239 890 6927r24 1741 14 46 960 5499先计算简单相
38、关系数,221.33.113.(1)(1)(.).(.)(.)(.).(.)(.)(.)(.)(ijikjkijij kikjkyyyrrrrrrr0 91620 5499 0 6972r0 888610 54992 10 692720 69270 5499 0 9162r0 564310 54992 10 916220 54990 9166 0 6972r10 91162 10将计算的各 代入.)0 94969272 当变量个数当变量个数M4时,由相关矩阵的逆矩阵元素时,由相关矩阵的逆矩阵元素计算偏相关系数较为简便,其方法步骤是:计算偏相关系数较为简便,其方法步骤是:由简单相关系数组成相关矩
39、阵由简单相关系数组成相关矩阵R;111212122212mmmmmmrrrrrrRrrr算出相关矩阵的逆矩阵算出相关矩阵的逆矩阵R-1;1112121222112mmmmmmccccccRccc ijjiijjiijijijiijjijijjicrccRR 1rrccr1rr上述 和都是以主对角线为轴对称的,即,。为各变量的自身相关,都等于。再由计算任何两个变量间的偏相关系数,r是对称的,如,但偏回归系数是不对称的.1313.1.R=.1.1yy11 8r0 5499r0 9162r0 69270 54990 91620 54990 69270 91620 6927R1根据例计算的简单相关系数
40、,得计算相关系数矩阵的逆矩阵,得-11.33.113.R=c.c./././(.ijijijijiijjyyycrcc 6 81491 11667 01361 11662 10382 47537 01362 47539 1408r7 01366 8149 9 14080 8886r2 47532 1038 9 14080 5645r1 11666将以上值代入,得.).8149 2 10380 29493、偏相关(回归)和简单相关(回归)的关系、偏相关(回归)和简单相关(回归)的关系131.33.1.yyyy11 1r0 9162r0 6927r0 8886r0 5645由表资料计算的简单相关系
41、数:偏相关系数:说明每株穗数说明每株穗数(x1)和千粒重和千粒重(x3)对单株产量的实际对单株产量的实际增产效应并不高,简单回归系数夸大了该效应增产效应并不高,简单回归系数夸大了该效应.13131.33.1././.yyyy11 1yxxb91 02 41 142 2124b73 52 46 961 5656b1 8485b0 6421由表资料计算 依 或 的简单回归系数:则偏回归系数为:从从上述结果看出,偏相关上述结果看出,偏相关(回归回归)和和简单相关简单相关(回归回归)系数,虽然都是线系数,虽然都是线性相关性相关(回归回归)系数,但得出这些系系数,但得出这些系数的条件不同。数的条件不同。
42、多变量资料,各变量间经常存在着多变量资料,各变量间经常存在着不同程度的相关,只有应用偏相关不同程度的相关,只有应用偏相关(回回归归)分析,消除自变量之间相关的混淆,分析,消除自变量之间相关的混淆,才能表现出各个自变量和依变量的真实才能表现出各个自变量和依变量的真实关系,才能正确评定任何两个变量间的关系,才能正确评定任何两个变量间的线性相关程度和回归影响。线性相关程度和回归影响。简单相关简单相关(回归回归)系数所表示的只是表系数所表示的只是表面的、非本质的关系,是不可靠的。这面的、非本质的关系,是不可靠的。这就是对多变量资料必须采用多元回归和就是对多变量资料必须采用多元回归和相关分析方法的原因相关分析方法的原因。