最新-第10章典型相关分析-PPT精品课件.ppt

上传人(卖家):三亚风情 文档编号:3533427 上传时间:2022-09-13 格式:PPT 页数:117 大小:1.24MB
下载 相关 举报
最新-第10章典型相关分析-PPT精品课件.ppt_第1页
第1页 / 共117页
最新-第10章典型相关分析-PPT精品课件.ppt_第2页
第2页 / 共117页
最新-第10章典型相关分析-PPT精品课件.ppt_第3页
第3页 / 共117页
最新-第10章典型相关分析-PPT精品课件.ppt_第4页
第4页 / 共117页
最新-第10章典型相关分析-PPT精品课件.ppt_第5页
第5页 / 共117页
点击查看更多>>
资源描述

1、1.两个随机变量两个随机变量Y与与X 2.一个随机变量一个随机变量Y与一组随机变量与一组随机变量X1,X2,Xp 3.一组随机变量一组随机变量Y1,Y2,Yq与另一组随机变量与另一组随机变量X1,X2,Xp 是研究是研究相关性的一种统计分析相关性的一种统计分析方法方法.也是一种降维技术也是一种降维技术.由由Hotelling(1935,1936)最早提最早提出,出,Cooley and Lohnes(1971)、Kshirsagar(1972)和和 Mardia,Kent,and Bibby(1979)推动了它的应用。推动了它的应用。),(21pXXX),(21qYYY 在解决实际问题中,这种

2、方法有广泛的应在解决实际问题中,这种方法有广泛的应用。用。如,在工厂里常常要研究产品的如,在工厂里常常要研究产品的q个质量指个质量指标标 和和p个原材料的指标个原材料的指标 之间的相关关系;也可以是采用典型相关分析之间的相关关系;也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。变量个数简化,又可以达到分析相关性的目的。),(21pXXX),(21qYYY:户主受教育程度:家庭的年收入:户主的年龄321YYY:每年外出看

3、电影频率率:每年去餐馆就餐的频21XX X1X2Y1Y2Y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00Y2Y3Y1X2X133122111112211111YbYbYbWXaXaV33222211222221122YbYbYbWXaXaV?),(11WV?),(22WV 首先分别在每组变量中找出第一对线性组首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,合,使其具有最大相关性,qqppYbYbYbWXaXa

4、XaV1221111112211111 然后再在每组变量中找出第二对线性组然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。关,第二对本身具有次大的相关性。V2和和W2与与V1和和W1相互独立相互独立,但但V2和和W2相关相关.如如此继续下去此继续下去,直至进行到直至进行到 r 步步,两组变量的相关性两组变量的相关性被提取完为止被提取完为止.R min(p,q),可以得到可以得到 r 组变量组变量.qqppYbYbYbWXaXaXaV2222112222221122 一般地一般地,假设有一组变量假设有一

5、组变量X1,Xp与与Y1,Yq,我们要我们要研究这两组变量的相关关系研究这两组变量的相关关系,如何给两组变量之间的相如何给两组变量之间的相关性以数量的描述关性以数量的描述?当当 时时,就是研究两个变量就是研究两个变量 X 与与 Y 之间的相关关系之间的相关关系.相相关系数就是最常见的度量关系数就是最常见的度量,其定义为其定义为)()(),(YVarXVarYXCovXY 当当 时时,p维随机向量维随机向量,),(1pXXX设设 则称则称,),(21pNYX,YYYXXYXXYYXYXXYXR1为为Y与与X1,Xp的的,全相关系数用于度量一个随机变量全相关系数用于度量一个随机变量Y与一组随机向量

6、与一组随机向量X1,Xp的相关关系的相关关系.当当 时时,利用主成分分析的思想利用主成分分析的思想,可以把多个变量与多个可以把多个变量与多个变量之间的相关化为两个新的综合变量之间的相关变量之间的相关化为两个新的综合变量之间的相关.也就是也就是 求求 和和 ,使得新的综合变量使得新的综合变量1),(p1),(qXXXXVpp2211和和YYYYWqq2211之间有最大可能的相关之间有最大可能的相关,基于这个思想就产生了典型相关分析基于这个思想就产生了典型相关分析.设设 及及 为随机向量为随机向量,我们用我们用1),(pXXX1),(qYYYX 和和 Y 的线性组合的线性组合 和和 之间的相关性来

7、研究两组随机变量之间的相关性来研究两组随机变量XYX 和和 Y 之间的相关性之间的相关性.我们希望找到我们希望找到 和和 ,使使 最大最大.),(YX由相关系数的定义由相关系数的定义)()(),(),(YVarXVarYXCovYX易得出对任意的常数易得出对任意的常数 e,f,c 和和 d,均有均有),()(,)(YXdYcfXe这说明使得相关系数最大的这说明使得相关系数最大的 并不唯一并不唯一.故求综合变量故求综合变量YX和常限定常限定 ,.于是有以下定义于是有以下定义.1)(XVar1)(YVar 设设 p+q 维随机维随机,),(1pXXX,),(1qYYY向量向量 的均值向量为的均值向

8、量为0,协方差阵协方差阵 0(不妨设不妨设pq).如果如果YX存在存在 和和 使得使得1111),(paaa,),(1111qbbb),(max),(1)(,1)(11YXYbXaYVarXVar则称则称 是是X,Y的的,它们之间的相它们之间的相YbXa11,关系数称为关系数称为.;1,)1(关对典型相关变量都不相和前面 kYbXakk;1)(,1)()2(YbVarXaVarkk,)3(的相关系数最大和YbXakk则称则称 是是X,Y的的,它们之间的相它们之间的相YbXakk,关系数称为关系数称为(k=2,p).如果存在如果存在1),(pkkkaaa,),(1qkkkbbb和使得使得设随机向

9、量设随机向量YXZ其中其中 (不妨设不妨设pq);11),(,),(qpYYYXXXE(Z)=0;以及以及D(Z)=.022211211令令 则则 V,W 的相关系数的相关系数,YWXV221112),(WV求第一对典型相关变量就等价于求求第一对典型相关变量就等价于求 和和1),(p,),(1q使使1)(1)(.),(max221112YVarXVartsYX用拉格朗日乘子法用拉格朗日乘子法,令令)1(2)1(2),(22211112(其中其中 1和和 2为拉格朗日乘子为拉格朗日乘子)为求为求 的极大值的极大值,对上式分别关于对上式分别关于 ,求偏导求偏导,并令其为零并令其为零,得得00222

10、2111112再分别用再分别用 左乘方程左乘方程(10.1.1),002222111112),(1221WVdef 得得则方程组则方程组(10.1.1)等价于等价于0022211211则方程组则方程组(10.1.2)有非零解的充要条件是有非零解的充要条件是022211211(10.1.3)该方程的左端是该方程的左端是 的的p+q次多项式次多项式.求解求解 的高次方程的高次方程(10.1.3),把求把求得的最大的得的最大的 代回方程组代回方程组(10.1.2),再求得再求得 和和 ,从而得出第一对从而得出第一对典型相关变量典型相关变量.具体计算时具体计算时,因因 的高次方程的高次方程(10.1.

11、3)不易解不易解;将其代入方程组将其代入方程组(10.1.2)后还需求解后还需求解(p+q)阶方程阶方程.为了计算上的简便为了计算上的简便,常作以下变换常作以下变换:用用 12 22-1左乘方程组左乘方程组(10.1.2)的第二项的第二项,022122122112212得得2112212121()将上将上()式代入方程组式代入方程组(10.1.2)得第一式得得第一式得:01211221211即即01122112212再用再用 11-1左乘上式得左乘上式得:0)(22112212111pI 的特征根的特征根是是 ,相应的特征向,相应的特征向量为量为21122121112将将 左乘左乘(10.1.

12、2)的第一式的第一式,并将第二式代入并将第二式代入,得得111210211211121121112121101221211121()再用再用 22-1左乘左乘()式得式得:0)(21211121122qI 的特征根的特征根是是 ,相应的特征向,相应的特征向量为量为21111121222故求解方程故求解方程(10.1.3)等价于求解方程组等价于求解方程组(10.1.4):002121112112222112212111qpII(10.1.4)由于由于 110,220,故故 11-1 0,22-1 0.-1-1111122221-1-1222211112M=M=令2221MM 至此,典型相关分析转

13、化为求至此,典型相关分析转化为求M1和和M2特特征根和特征向量的问题。征根和特征向量的问题。第一对典型变量提取了原始变量第一对典型变量提取了原始变量X与与Y之之间相关的主要部分,如果这部分还不能足以间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。第二对典型变量和他们的典型相关系数。在剩余的相关中再求出第二对典型变量和他们的典型相关系在剩余的相关中再求出第二对典型变量和他们的典型相关系数数.设第二对典型变量为:设第二对典型变量为:XV22YW22求第二对典型相关变量就等价于求求第二对典型相关变量

14、就等价于求 2和和 2,使使1)(1)(.),(max2222221122212222YVarXVartsYX0),(211121VVCov0),(222121WWCov 设设YXZ11),(,),(qpYYYXXX(不妨设不妨设pq);E(Z)=0,D(Z)=.022211211,其中其中记记,2121221211T并设并设 p 阶方阵阶方阵 的特征值依次为的特征值依次为TT;),2,1,0(022221piip而而l1,lp为为相应的单位正交特征向量相应的单位正交特征向量.令令),2,1(,2112211121pkablakkkkkYbWXaVkkkk,则为为X 和和Y 的第的第 k 对典

15、型相关变量对典型相关变量.k为第为第k个典型相关系数个典型相关系数.:户主受教育程度:家庭的年收入:户主的年龄321YYY:每年外出看电影频率率:每年去餐馆就餐的频21XX分析两组变量之间的关系。分析两组变量之间的关系。X1X2Y1Y2Y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00典型相关分析典型相关分析 典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差 典型相关系典型相关系数的平方数的平方10

16、.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919X组典型变量的系数组典型变量的系数 V1V2X1(就餐)就餐)-1.4787X2(电影电影)0.2721Y组典型变量的系数组典型变量的系数 W1W2Y1(年龄年龄)0.0491Y2(收入收入)-0.5837Y3(文化文化)0.19000.29562112721.07689.0XXV2126443.14787.1XXV32111900.08975.00491.0YYYW32122956.05837.00003.1YYYWYbWXaVkkkk,因为特征向量之间是正交的因为

17、特征向量之间是正交的.故故0),(),(11jijijiaaXaXaCovVVCov)(ji0),(),(22jijijibbYaYbCovWWCov)(ji不同组内一对典型变量之间的相关系数为不同组内一对典型变量之间的相关系数为),(),(YbXaCovWVCovjijijijii,0,同对则协方差为同对则协方差为 ,不同对则为零。,不同对则为零。i:户主受教育程度:家庭的年收入:户主的年龄321YYY:每年外出看电影频率率:每年去餐馆就餐的频21XX分析两组变量之间的关系。分析两组变量之间的关系。X1X2Y1Y2Y3X11.000.800.260.670.34X20.801.000.330

18、.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00典型相关分析典型相关分析 典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差 典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919X组典型变量的系数组典型变量的系数 V1V2X1(就餐)就餐)-1.4787X2(电影电影)0.2721Y组典型变量的系数组典型变量的系数 W1W2Y1(年龄年龄)0.0491Y2(收入

19、收入)-0.5837Y3(文化文化)0.19000.29562112721.07689.0XXV2126443.14787.1XXV32111900.08975.00491.0YYYW32122956.05837.00003.1YYYW典型变量的结构(相关系数)典型变量的结构(相关系数)V1V2X10.9866-0.1632X20.88720.4614 W1W2Y10.42110.8464Y20.9822-0.1101Y30.51450.3013典型变量的结构(相关系数)典型变量的结构(相关系数)W1W2X10.6787-0.0305X20.61040.0862 V1V2Y10.28970.1

20、582Y20.6757-0.0206Y30.35390.0563 两个反映消费的指标与第一对典型变量中两个反映消费的指标与第一对典型变量中V1的相关系数分别为的相关系数分别为0.9866和和0.8872,可以看,可以看出出V1可以作为消费特性的指标,第一对典型变可以作为消费特性的指标,第一对典型变量中量中V1与与Y2之间的相关系数为之间的相关系数为0.9822,可见典,可见典型变量型变量V1主要代表了了家庭收入,主要代表了了家庭收入,V1和和 W1的的相关系数为相关系数为0.6879,这就说明家庭的消费与一,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;个家庭的收入之间其关系是很密切

21、的;22211211RRRR12111211222112212111)()()()(RRRRBRRRRA 求求X,Y 变量组的相关阵变量组的相关阵R=求矩阵求矩阵A、B 可以证明可以证明A、B有相同的非零特征根有相同的非零特征根 3.求求A或或B的的i(相关平方相关平方)与与Cov(Vi,Wi),i1,m 4.求求A、B关于关于i的特征根向量即变量系数的特征根向量即变量系数已知已知X、Y 的相关阵的相关阵R=22211211RRRR试求试求X、Y 的典型相关变量和典型相关系数的典型相关变量和典型相关系数.Cov(X)R11Cov(Y)R22Cov(Y,X)R21Cov(X,Y)R1212111

22、211222112212111)()()()(RRRRBRRRRA0IBIAA A、B B有相同的非零特征值有相同的非零特征值1482.03544.05110.07373.08742.05544332211RRRRR。的方差为此外,还应满足的矩阵为:关于第一特征根如矩阵17643.03142.02171.00210.01757.01421.00948.00806.00061.003770.00669.00979.00915.01759.02523.03877.00510.00376.00966.04468.05238.00840.05489.02739.02274.00168.00007.01

23、939.01669.00701.00912.01778.02919.03986.03053.04586.05298.07643.0A*616*1111161514131211161514131211XaXaVaaaaaaaaaaaaaAa。的方差为此外,还应满足的矩阵为:关于第一特征根如矩阵15436.03142.02171.00210.01757.01421.00948.00806.00061.003770.00669.00979.00915.01759.02523.03877.00510.00376.00966.04468.05238.00840.05489.02739.02274.001

24、68.00007.01939.01669.00701.00912.01778.02919.03986.03053.04586.05298.05436.0A*626*1212262524232221262524232221XaXaVaaaaaaaaaaaaaAa。的方差为此外,还应满足的矩阵为:关于第一特征根如矩阵1022.03142.02171.00210.01757.01421.00948.00806.00061.003770.00669.00979.00915.01759.02523.03877.00510.00376.00966.04468.05238.00840.05489.02739

25、.02274.00168.00007.01939.01669.00701.00912.01778.02919.03986.03053.04586.05298.0022.0A*656*1515565554535251565554535251XaXaVaaaaaaaaaaaaaAaSXXXXXXXVXXXV*6*2*15*6*2*11X5140.05590.18298.0.1948.02175.05852.0原变量,即的表示为正态离差标准化常数)()()(),、()、,)、(,(为对应的均数标准差分别、如6216211621*6*2*115069.03153.04074.03842.017.271

26、948.06897.620.922175.04365.137.1705852.03842.017.276897.620.924365.137.1701948.02175.05852.0XXXXXXVXXXXXXVjijijSaa/*两变量组的变量单位改变两变量组的变量单位改变,典型相关系数不变典型相关系数不变,但典型变量系数改变但典型变量系数改变(无论原变量标准化与否无论原变量标准化与否,获得的典型相关系数不变获得的典型相关系数不变).第一对典则相关系数较两组变量间任一个简第一对典则相关系数较两组变量间任一个简单相关系数或复相关系数之绝对值都大单相关系数或复相关系数之绝对值都大,即即R1max

27、(|Cov(Xi,Yj)|)或或 R1max(|Cov(X,Yj)|),R1max(|Cov(Xi,Y)|)已知总体已知总体 Z 的的 n 次观测数据为次观测数据为:)()()(tttYXZ1)(qp),2,1(nt于是样本数据阵为于是样本数据阵为nqnnpnqpqpqpqpyyxxyyxxyyxxyyxxyyxx11441441331231221221111111)(qpn若假定若假定ZNp+q(,),则协方差阵则协方差阵 的最大似然估计为的最大似然估计为ntttZZZZn1)()()(1其中其中.11)(nttZnZ令令 S矩阵也称为样本协方差阵矩阵也称为样本协方差阵.,1nnSqnqnp

28、npnqqppqqppqqppqqppyyyyxxxxyyyyxxxxyyyyxxxxyyyyxxxxyyyyxxxx111141414141313121312121212111111111设设 ,11为为p阶矩阵阶矩阵.将将S相应剖分为相应剖分为2221121122211211SSSSS显然显然,Sij(i,j=1,2)是是 ij的无偏估计的无偏估计.下面我们将从样本协下面我们将从样本协方差阵方差阵S出发出发,来讨论两组变量间的相关关系来讨论两组变量间的相关关系.计算计算 S 的特征根和特征向量的特征根和特征向量)(21122121111SSSSM令:)(12111211222SSSSM22

29、221r),2,1(riii和全部总体典型相关系数均为全部总体典型相关系数均为0部分总体典型相关系数为部分总体典型相关系数为0 典型相关分析是否恰当典型相关分析是否恰当,应该取决于两组原变量之应该取决于两组原变量之间是否相关间是否相关,如果两组变量之间毫无相关性而言如果两组变量之间毫无相关性而言,则不应则不应该作典型相关分析该作典型相关分析.用样本来估计总体的典型相关系数用样本来估计总体的典型相关系数是否有误是否有误,需要进行检验需要进行检验.qpnNYXqp)2().,(,)1()即设(量正态分布。两个变量组应服从多变对资料的要求:):;:(121120OHOH0:10pH中至少有一个不为零

30、),2,1(:1piHi检验的统计量:检验的统计量:|22110SSS(似然比统计量似然比统计量)22211211SSSSSIOSSISSSSISSOI1211222112111121111211212211SSSSOOS1所以,两边同时求行列式,有所以,两边同时求行列式,有222112111211222112111121SSSSIOSSISSSSISSOI11事实上事实上212212112222211211SSSSSSSSSS1|212212111122SSSSISS11MISSSSISSS21221211221111|)()1(MIIMIIIMIMISSSSISSS212212112211

31、11|piip1222221)1()1()1)(1(ln)3(21qpnQ中至少有一个非零pkkkHpkH,:),3,2(0:2)(1)(0 当否定当否定H0时时,表明表明X,Y相关相关,进而可得出至少第一个进而可得出至少第一个相关系数相关系数 10,相应的第一对典型相关变量相应的第一对典型相关变量V1,W1可能可能已经提取了两组变量相关关系的绝大部分信息已经提取了两组变量相关关系的绝大部分信息.两组变两组变量余下的部分可认为不相关量余下的部分可认为不相关,这时这时 k0(k=2,p).因此因此在否定在否定H0后后,有必要再检验有必要再检验H0(k):k=0(k=2,p),即第即第k个个及以后

32、的所有典型相关系数均为及以后的所有典型相关系数均为0(k=2,3,p).检验的统计量检验的统计量pkiikqpknQ)1ln()1(212 近似服从自由度为近似服从自由度为(p-k+1)(q-k+1)的的 2分布分布.在给在给定的显著性水平定的显著性水平 下下,如果如果 2 2(p-k+1)(q-k+1),则拒则拒绝原假设绝原假设H0(k),即第即第k个典型相关系数显著的不等于个典型相关系数显著的不等于0.否则认为否则认为 k=0.对对H0(k)从从k=2开始逐个检验开始逐个检验,知道某个知道某个k0,使使 相容时为止相容时为止.这时说明第这时说明第k0个及以后的所有典个及以后的所有典型相关系

33、数均为型相关系数均为0.)(00kH 假设经检验假设经检验,有有r(rp)个典型相关系数显著不等于个典型相关系数显著不等于0,这时可得这时可得 r 对典型相关变量对典型相关变量(Vi,Wi)(i=1,r).将样品将样品)()()(tttYXZ),2,1(nt代入第代入第 i 对典型变量中对典型变量中,令令)()()()(YYbwXXavtitititi),1;,1(ntri称称(vti,wti)为第为第i个样品个样品Z(t)的第的第i对对.左上角的矩阵左上角的矩阵 X1=0.9050V1-0.0806V2+0.3777V3-0.1487V4+0.0887V5 X2=0.8616V1+0.011

34、2V2+0.4152V3-0.0360V4+0.2412V5X6右下角的矩阵右下角的矩阵 Y1=-0.4130 W1-0.0848W2+0.7353W3+0.4530W4+0.2764W5 Y2=0.4533W1+0.8452W2+0.0968W3+0.1433W4+0.2240W5.Y5jjijijjijiRWYCovVYCovRVXCovWXCov),(),(),(),(右上角和左下角反映了原变量和对右上角和左下角反映了原变量和对方的典型变量间关系,为利用对方的典方的典型变量间关系,为利用对方的典型变量来预测原变量型变量来预测原变量(回归回归)提供依据提供依据 X1X2X3X4X5Y1Y2

35、Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.530.300.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.120.190.210.290.16X50.510.530.570.571.000.380.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.

36、340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.170.270.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.460.281.000.350.59Y60.370.350.370.290.360.370.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.

37、590.311.00 Canonical Correlation Analysis AdjustedCanonicalCorrelationApproxCanonicalCorrelationSquaredStandardError CanonicalCorrelation10.5537060.5530730.0069340.30659120.2364040.2346890.0094420.05588730.119186.0.0098580.01420540.072228.0.0099480.00521750.057270.0.0099680.003280 V1V2V3V4V5X10.4217

38、0.3429-0.8577-0.78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392X组的典型变量组的典型变量 W1W2W3W4W5Y10.4252-0.08800.4918-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.60590.3457Y40.02

39、350.9260-0.00650.40440.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141Y 组的典型变量组的典型变量 V1V2V3V4V5X10.82930.1093-0.4853-0.24690.0611X20.7304-0.43660.20190.00210.4857X30.7533-0.4661-0.10560.3020-0.3360X40.61600.2225-0.20530.66140.3026X50.86060.

40、26600.38860.1484-0.1246 W1W2W3W4W5Y10.75640.04460.3395-0.1294-0.3370Y20.64390.3582-0.1717-0.3530-0.3335Y30.38720.0373-0.1767-0.53480.4148Y40.37720.7919-0.00540.28860.3341Y50.65320.10840.2092-0.43760.4346Y60.8040-0.2416-0.23480.40520.1964Y70.50240.16280.4933-0.18900.0678原始变量与本组典型变量之间的相关系数 W1W2W3W4W5X

41、10.45920.0258-0.0578-0.01780.0035X20.4044-0.10320.02390.00020.0278X30.4171-0.1102-0.01260.0218-0.0192X40.34110.0526-0.02450.04780.0173X50.47650.06290.04630.0107-0.0071 V1V2V3V4V5Y10.41880.01050.0405-0.0093-0.0193Y20.35650.0847-0.0205-0.0255-0.0191Y30.21440.0088-0.0211-0.03860.0238Y40.20880.1872-0.00

42、060.02080.0191Y50.36170.02560.0249-0.03160.0249Y60.4452-0.0571-0.02800.02930.0112Y70.27820.03850.0588-0.01360.0039原始变量与对应组典型变量之间的相关系数5818.0)85.074.083.0(512221Vm3721.0)50.065.075.0(712221Wn 该方法由该方法由Stewart and Love 1968;Cooley and Lohnes 1971;van den Wollenberg 1977)发展。发展。以原变量与典型变量间相关为基础。以原变量与典型变量间相

43、关为基础。通过计算通过计算X、Y变量组由自己的典型变量解变量组由自己的典型变量解释与由对方的典型变量解释的方差百分比与释与由对方的典型变量解释的方差百分比与累计百分比,反映由典型变量预测原变量的累计百分比,反映由典型变量预测原变量的程度。程度。9994.22433.01356.06958.09361.08616.09050.0)|()|(222222112|如VXRRVXRdpjVXidij0836.05436.01537.0)|()|()|(22如VYRRWYRVYRdiidid V1,V2,V5并没有完全概括并没有完全概括 X 变量变量的全部信息的全部信息(97.24),而,而W1,W2,

44、W5 却概括了却概括了 Y 变量的全部信息变量的全部信息(100);W1,W2,W5中仅蕴含中仅蕴含 X 变量信息的变量信息的48.44%,而,而V1,V2,V5中仅蕴含中仅蕴含 Y 变变量信息的量信息的43.96%。实例冗余分析的解释实例冗余分析的解释 无直接菜单点击无直接菜单点击 可借用可借用Analyze General Linear Model Multivariate 可采用可采用File New Syntax Canonical Correlation.sps(注意修改相应的两组注意修改相应的两组变量的变量名变量的变量名)SPSS所在路径所在路径Canonical correlat

45、ion.sps.SET1=第一组变量的列表第一组变量的列表 /SET2=第二组变量的列表第二组变量的列表.例题:例题:课后习题十中的课后习题十中的(10-5)某学校研究学生的体质与运动能力的关系某学校研究学生的体质与运动能力的关系,对对38名学生的名学生的,每人测试了每人测试了7项指标项指标:X1(反复横荡的次数反复横荡的次数)、X2(纵跳高度纵跳高度)、X3(背力背力)、X4(握力握力)、X5(踏台升降指数踏台升降指数)、X6(立姿体前屈立姿体前屈)、X7(卧姿上体后仰卧姿上体后仰);对对每人测试了每人测试了5项指标项指标:X8(50米米跑跑)、X9(1000米长跑米长跑)、X10(投掷投掷

46、)、X11(悬垂次数悬垂次数)、X12(持久走持久走).试对这两组数据进行典型相关分析试对这两组数据进行典型相关分析.INCLUDE C:program filesspss13Canonical correlation.sps.CANCORR SET1=X1 to X7 /SET2=X8 to X12.选择菜单选择菜单Run All,运行上述程序运行上述程序,即可得到典型相即可得到典型相关分析的结果关分析的结果.因结果输出内容较多因结果输出内容较多,下面将对其加以解下面将对其加以解释释.由体质测试指标的内部相由体质测试指标的内部相关系数看关系数看,各指标间的相关各指标间的相关系数较小系数较小,

47、即指标间没有多即指标间没有多大的重复大的重复.如果两个指标的如果两个指标的相关系数很大相关系数很大,可能这两个可能这两个指标反映的是同一个方面指标反映的是同一个方面,可以考虑合并可以考虑合并.运动能力测试指标间的相运动能力测试指标间的相关系数也比较类似关系数也比较类似.体质情况和运动能力之间的相关性系数体质情况和运动能力之间的相关性系数,从二者的直接相关系从二者的直接相关系数看数看,X9(1000米长跑米长跑)和和X2(纵跳高度纵跳高度)之间有关联程度较大之间有关联程度较大,相关相关系数为系数为0.6111,而其他体质情况指标和运动能力指标间的直接关而其他体质情况指标和运动能力指标间的直接关联

48、似乎不大联似乎不大,更多的可能是综合影响更多的可能是综合影响.但是由于变量之间的交互但是由于变量之间的交互作用作用,因此这个简单相关系数矩阵只能作为参考因此这个简单相关系数矩阵只能作为参考,不能真正反映不能真正反映两组变量间的实质联系两组变量间的实质联系.典型相关系数典型相关系数.第一典型相第一典型相关系数为关系数为0.851,第二典型相第二典型相关系数为关系数为0.720,均比体质指均比体质指标和运动能力指标两组间标和运动能力指标两组间的任一个相关系数都大的任一个相关系数都大,即即综合的典型相关分析效果综合的典型相关分析效果较好于简单相关分析较好于简单相关分析.由于此处的典型相关系数都是从由

49、于此处的典型相关系数都是从样本数据算得的样本数据算得的,和简单相关系数和简单相关系数一样一样,这里也有必要进行其总体系这里也有必要进行其总体系数是否为数是否为0的假设检验的假设检验.此处采用此处采用的是的是 2检验检验,零假设为对应的典型零假设为对应的典型相关系数为相关系数为0.由表知由表知,第一典型相第一典型相关系数和第二典型相关系数的显关系数和第二典型相关系数的显著性概率著性概率(Sig.)为为0.000和和0.006,在在=0.05的情况下的情况下,否定典型相关系否定典型相关系数为零的假设数为零的假设,说明这两对典型变说明这两对典型变量间的相关性是显著的量间的相关性是显著的.来自体质情况

50、的第一典型相关变量为来自体质情况的第一典型相关变量为:*7*6*5*4*3*2*11006.0112.0263.0050.0596.0237.0445.0 xxxxxxxV来自运动能力的第一典型相关变量为来自运动能力的第一典型相关变量为:*12*11*10*9*81407.0038.0376.0113.0477.0 xxxxxW 在第一对典型变量中在第一对典型变量中,大部分变量的系数都比较均匀大部分变量的系数都比较均匀,无论是无论是体质指标还是运动能力指标的系数都表明体质指标还是运动能力指标的系数都表明,其测试结果越好其测试结果越好,则表则表明其综合运动能力越强明其综合运动能力越强,可以解释为

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(最新-第10章典型相关分析-PPT精品课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|