1、第八讲典型相关分析典型相关分析典型相关分析典型相关分析(Canonical correlation)典型相关分析(典型相关分析(Canonical correlation)是研究两组变量之间相关关系的一种多是研究两组变量之间相关关系的一种多元统计方法,它能够揭示出两组变量之元统计方法,它能够揭示出两组变量之间的内在联系。间的内在联系。这一方法是由这一方法是由Hotelling(霍特林,(霍特林,1935)首先提出来的。首先提出来的。两组变量的相关问题两组变量的相关问题 我们知道如何衡量两个变量之间是我们知道如何衡量两个变量之间是否相关的问题;这是一个简单的公否相关的问题;这是一个简单的公式就可
2、以解决的问题(式就可以解决的问题(PearsonPearson相关相关系数、系数、Kendalls tKendalls t、Spearman Spearman 秩相关系数秩相关系数)。如果我们有两组变量,如何表明它如果我们有两组变量,如何表明它们之间的关系呢?们之间的关系呢?典型相关分析典型相关分析(Canonical correlation)在实际问题中,经常遇到要研究一部分变量与在实际问题中,经常遇到要研究一部分变量与另一部分变量之间的相互关系。例如:在工厂,另一部分变量之间的相互关系。例如:在工厂,考察原料的主要指标考察原料的主要指标 与产品的主要指标与产品的主要指标 ;在经济学;在经济
3、学中,研究商品的价格与销售之间的关系;在教中,研究商品的价格与销售之间的关系;在教育学中,考察研究生入学考试成绩与本科阶段育学中,考察研究生入学考试成绩与本科阶段一些主要课程成绩的相关性,等等。一些主要课程成绩的相关性,等等。),(21pXXX),(21qYYY典型相关分析典型相关分析(Canonical correlation)典型相关分析的目的是识别并量化两组典型相关分析的目的是识别并量化两组变量之间的联系,将两组变量相关关系变量之间的联系,将两组变量相关关系的分析转化为一组变量的线性组合与另的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析。一组变量线性组合之间的相关关
4、系分析。一、典型相关分析的基本思想一、典型相关分析的基本思想典型相关分析的基本思想和主成分分析非常相似。典型相关分析的基本思想和主成分分析非常相似。首先在每组变量中找出变量的线性组合,使得两组的线性组合之首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。间具有最大的相关系数。然后选取和最初挑选的这对线性组合不相关的线性组合,使其配然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去,直到两组变量之间对,并选取相关系数最大的一对,如此下去,直到两组变量之间的相关性被提取完毕为止。的相关性被提取完毕为止。被选出的线性组合配对称为
5、典型变量(被选出的线性组合配对称为典型变量(canonical variable),它),它们的相关系数称为典型相关系数(们的相关系数称为典型相关系数(canonical coefficient)。典型)。典型系数度量了这两组变量之间联系的强度。系数度量了这两组变量之间联系的强度。例例.1.1 例如:业内人士和观众对于一些电视节目的观点例如:业内人士和观众对于一些电视节目的观点有什么样的关系呢?有什么样的关系呢?数据是不同的人群对数据是不同的人群对3030个电个电视节目所作的平均评分。视节目所作的平均评分。观众评分来自低学历观众评分来自低学历(led)(led)、高学历高学历(hedhed)和
6、网络和网络(net)(net)调查三种,它们形成调查三种,它们形成第一组变量第一组变量;而业内人士分评分来自包括演员和导演在内的艺而业内人士分评分来自包括演员和导演在内的艺术家术家(artiarti)、发行发行(com)(com)与业内各部门主管与业内各部门主管(man)(man)三种,形成三种,形成第二组变量第二组变量。人们对这样两组变量之。人们对这样两组变量之间的关系感到兴趣。间的关系感到兴趣。第一组第一组变量变量:观众观众第二组第二组变量变量:业内业内人士人士低低学学历历高高学学历历网网络络主主管管发发行行人人艺艺术术家家典型相关典型相关如何进行典型相关如何进行典型相关 如果直接对这六个
7、变量的相关进行两两如果直接对这六个变量的相关进行两两分析,很难得到关于这两组变量之间关分析,很难得到关于这两组变量之间关系的一个清楚的印象。系的一个清楚的印象。希望能够把多个变量与多个变量之间的希望能够把多个变量与多个变量之间的相关化为相关化为两个两个变量之间的相关。变量之间的相关。现在的问题是为每一组变量现在的问题是为每一组变量选取一个综选取一个综合变量作为代表;合变量作为代表;而一组变量最简单的综合形式就是该组而一组变量最简单的综合形式就是该组变量的变量的线性组合线性组合。如何进行典型相关如何进行典型相关 由于一组变量可以有无数种线性组合由于一组变量可以有无数种线性组合(线性组合由相应的系
8、数确定),因此(线性组合由相应的系数确定),因此必须找到必须找到既有意义又可以确定的线性组既有意义又可以确定的线性组合。合。典型相关分析典型相关分析(canonical correlation(canonical correlation analysis)analysis)就是要找到这两组变量线性组就是要找到这两组变量线性组合的系数,使得这两个由线性组合生成合的系数,使得这两个由线性组合生成的变量(和其他线性组合相比)之间的的变量(和其他线性组合相比)之间的相关系数最大。相关系数最大。XV1V2|VdYW1W2|Wdx1x2xiy1y2yjcr1cr2crdd=min(i,j)(V=a0+a1
9、x1+aixi)(W=b0+b1y1+bjyj)二、典型相关分析的原理及方法二、典型相关分析的原理及方法二、典型相关分析的原理及方法二、典型相关分析的原理及方法三、样本的典型相关分析三、样本的典型相关分析(一)样本典型相关系数的计算(一)样本典型相关系数的计算 在实际分析应用中,总体的协方差矩阵在实际分析应用中,总体的协方差矩阵通常是未知的,往往需要从研究的总体通常是未知的,往往需要从研究的总体中随机抽取一个样本,根据样本估计出中随机抽取一个样本,根据样本估计出总体的协差阵,并在此基础上进行典型总体的协差阵,并在此基础上进行典型相关分析。相关分析。三、样本的典型相关分析三、样本的典型相关分析三
10、、样本的典型相关分析三、样本的典型相关分析样本均值向量)2()1(XXX,其中,naaXnX1)1()1(1,naaXnX1)2()2(1。样本协差阵为22211211,其中,)()(1)()()()(11lkjnjkkjklXXXXn,2,1,lk。三、样本的典型相关分析三、样本的典型相关分析由此得到矩阵1M和2M的样本估计 1211121122221122121111MM 如前所述,求解1M和2M的特征根及其相应的特征向量,即可得到所要求的典型相关变量及其典型相关系数。建立第一对典型变量建立第一对典型变量(函数函数)的原则的原则 尽量使所建的两个典型变量之间的相关尽量使所建的两个典型变量之
11、间的相关系数最大化,就是在两个变量组各自的系数最大化,就是在两个变量组各自的总变化中先寻求他们之间最大的一部分总变化中先寻求他们之间最大的一部分共变关系,并用一对典型变量所描述。共变关系,并用一对典型变量所描述。因而,第一维度上的典型相关系数也随因而,第一维度上的典型相关系数也随之求的。之求的。建立第二对典型变量建立第二对典型变量(函数函数)的原则的原则 继续在两组变量剩余的变化中寻找第二继续在两组变量剩余的变化中寻找第二个最大的共变部分,形成第二对典型变个最大的共变部分,形成第二对典型变量,并解出第二维度上的典型相关系数。量,并解出第二维度上的典型相关系数。依此类推,直至所有变化部分被剥离完
12、依此类推,直至所有变化部分被剥离完毕。毕。典型相关系数典型相关系数 这里所涉及的主要的数学工具还是矩阵的特这里所涉及的主要的数学工具还是矩阵的特征值和特征向量问题。而所得的特征值与征值和特征向量问题。而所得的特征值与V和和W的典型相关系数有直接联系。的典型相关系数有直接联系。由于特征值问题的特点,实际上找到的是多由于特征值问题的特点,实际上找到的是多组典型变量组典型变量(V1,W1),(V2,W2),,其中其中V1和和W1最相关,而最相关,而V2和和W2次之等等,次之等等,而且而且V1,V2,V3,之间及之间及W1,W2,W3,之间互之间互不相关。这样又出现了选择多少组典型变量不相关。这样又出
13、现了选择多少组典型变量(V,W)的问题了。实际上,只要选择特征值累的问题了。实际上,只要选择特征值累积总贡献占主要部分的那些即可。积总贡献占主要部分的那些即可。注意注意 严格地说,一个典型相关系数描述的只严格地说,一个典型相关系数描述的只是一对典型变量之间的相关,而不是两是一对典型变量之间的相关,而不是两个变量组之间的相关。个变量组之间的相关。而各对典型变量之间构成的多维典型相而各对典型变量之间构成的多维典型相关才共同揭示了两个观测变量组之间的关才共同揭示了两个观测变量组之间的相关形式。相关形式。但但是是有有可可能能得得到到的的两两组组变变量量的的样样本本协协差差阵阵不不为为零零,因因此此,在
14、在用用样样本本数数据据进进行行典典型型相相关关分分析析时时,应应就就两两组组变变量量的的协协差差阵阵是是否否为为零零进进行行检检验验。即即对对假假设设1211200:,0:HH进进行行检检验验,似似然然比比统统计计量量近近似似服服从从2分分布布。在在给给定定显显著著性性水水平平下下,当当统统计计量量大大于于临临界界值值时时,拒拒绝绝原原假假设设,认认为为两两组组变变量量间间存存在在相相关关性性。即对假设即对假设 0:,0:11210krkkHH 进行检验,似然比统计量进行检验,似然比统计量2分布。先从分布。先从k=0进行进行检验,若拒绝原假设,则至少有一个典型相关系数大检验,若拒绝原假设,则至
15、少有一个典型相关系数大于零,自然应该是最大的典型相关系数于零,自然应该是最大的典型相关系数01。重复以上步骤直至接受原假设重复以上步骤直至接受原假设 0:10rjjH,此时选取,此时选取1j对典型变量进行分析对典型变量进行分析。(一)(一)典型相关模型的基本假设和数据要求典型相关模型的基本假设和数据要求 要求两组变量之间为线性关系,即每对典型变要求两组变量之间为线性关系,即每对典型变量之间为线性关系;量之间为线性关系;每个典型变量与本组所有观测变量的关系也是每个典型变量与本组所有观测变量的关系也是线性关系。如果不是线性关系,可先线性化:线性关系。如果不是线性关系,可先线性化:如经济水平和收入水
16、平与其他一些社会发展水如经济水平和收入水平与其他一些社会发展水之间并不是线性关系,可先取对数。之间并不是线性关系,可先取对数。即即log经济水平,经济水平,log收入水平。收入水平。(二)从相关矩阵出发计算典型相关(二)从相关矩阵出发计算典型相关 典型相关分析涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。因此,为了消除量纲和数量级别的影响,必须对数据进行标准化处理,然后再进行典型相关分析。经过标准变换后的协差阵就是相关系数矩阵,因而,也通常应从相关矩阵出发进行典型相关分析。其结果同从协差阵出发得到的特征值相同,因此检验结果也相同。提取第一典型变量,按照类似方法可求得典型变量系数向量
17、,即可得到标准化的第一对典型变量。(三)典型载荷分析(三)典型载荷分析 进行典型载荷分析有助于更好解释分析已提取的对典型变量。所谓的典型载荷分析是指原始变量与典型变量之间相关性分析。(四)典型冗余分析(四)典型冗余分析 在进行样本典型相关分析时,我们也想了解每组变量提取出的典型变量所能解释的该组样本总方差的比例,从而定量测度典型变量所包含的原始信息量的大小。六、典型相关分析实例六、典型相关分析实例 下面就例下面就例1 1数据进行典型相关分析的说明数据进行典型相关分析的说明头两对典型变量头两对典型变量(V,W)的累积特征根已经占了总的累积特征根已经占了总量的量的99.427%99.427%。它们
18、的典型相关系数也都在。它们的典型相关系数也都在0.950.95之上。之上。典型相关系数的平方典型相关系数的平方 与简单相关系数一样,典型相关系数的实际意与简单相关系数一样,典型相关系数的实际意义并不十分明确。义并不十分明确。所以,由经验的研究人员往往更愿意采用典型所以,由经验的研究人员往往更愿意采用典型相关系数的平方(相当于回归分析中的确定系相关系数的平方(相当于回归分析中的确定系数)。数)。由于相关涉及的两个典型变量都是标准化的,由于相关涉及的两个典型变量都是标准化的,所以双方的方差都等于所以双方的方差都等于1。典型相关系数的平。典型相关系数的平方的实际意义是一对典型变量之间的共享方差方的实
19、际意义是一对典型变量之间的共享方差在两个典型变量各自方差中的比例。在两个典型变量各自方差中的比例。典型相关系数的检验典型相关系数的检验 整体检验:整体检验:0:210dcrcrcrH典型相关系数的检验典型相关系数的检验 维度递减检验:仍然是一种多元检验,维度递减检验:仍然是一种多元检验,但可以提供每对典型变量的典型相关是但可以提供每对典型变量的典型相关是否显著的信息。否显著的信息。Dimension Reduction AnalysisRootsWilks L.F HypothDFError DFSig.of F1 to 32 to 33 to 30.000500.054710.5938214
20、1.58046 40.94049 17.78432 9.00 4.00 1.00 58.56 50.00 26.00 0.000 0.000 0.000典型系数典型系数 下面表格给出的是第一组变量相应于上面三个下面表格给出的是第一组变量相应于上面三个特征根的三个典型变量特征根的三个典型变量V V1 1、V V2 2和和V V3 3的系数,即的系数,即典型系数典型系数(canonical coefficient)(canonical coefficient)。这些系数以两种方式给出;一种是没有标准化这些系数以两种方式给出;一种是没有标准化的原始变量的线性组合的典型系数的原始变量的线性组合的典型系
21、数(raw(raw canonical coefficient)canonical coefficient),一种是一种是标准化标准化之后之后的典型系数的典型系数(standardized canonical(standardized canonical coefficient)coefficient)。标准化的典型系数直观上对典标准化的典型系数直观上对典型变量的构成给人以更加清楚的印象。型变量的构成给人以更加清楚的印象。典型系数典型系数 可以看出,头一个典型变量可以看出,头一个典型变量V V1 1相应相应于前面第一个(也是最重要的)特于前面第一个(也是最重要的)特征值,主要代表征值,主要代表
22、高学历变量高学历变量hedhed;而相应于前面第二个(次要的)特而相应于前面第二个(次要的)特征值的第二个典型变量征值的第二个典型变量V V2 2主要代表主要代表低学历变量低学历变量ledled和部分的网民变量和部分的网民变量netnet,但高学历变量在这里起负面作但高学历变量在这里起负面作用。用。典型系数典型系数 类似地,也可以得到被称为协变量类似地,也可以得到被称为协变量(covariate)(covariate)的标准化的第二组变量的相应于头三个特征值的标准化的第二组变量的相应于头三个特征值得三个典型变量得三个典型变量W W1 1、W W2 2和和W W2 2的系数:的系数:典型负载(相
23、关)系数典型负载(相关)系数 也称为因变量或协变量与典型变量之间也称为因变量或协变量与典型变量之间的两两相关系数。的两两相关系数。例子结论例子结论 从这两个表中可以看出从这两个表中可以看出,V V1 1主要和变量主要和变量hedhed相关,相关,而而V V2 2主要和主要和ledled及及netnet相关相关;W W1 1主要和变量主要和变量artiarti及及manman相相关,关,而而W W2 2主要和主要和comcom相关;这和它们的典型系数是一相关;这和它们的典型系数是一致的。致的。由于由于V V1 1和和W W1 1最相关,这说明最相关,这说明V V1 1所代表的高学历观众所代表的高
24、学历观众和和W W1 1所主要代表的艺术家所主要代表的艺术家(artiarti)及各部门经理及各部门经理(man)(man)观点相关;观点相关;而由于而由于V V2 2和和W W2 2也相关,这说明也相关,这说明V V2 2所代表所代表的低学历的低学历(led)(led)及以年轻人为主的网民及以年轻人为主的网民(net)(net)观众和观众和W W2 2所主要代表的看重经济效益的发行人所主要代表的看重经济效益的发行人(com)(com)观点相观点相关,关,但远远不如但远远不如V V1 1和和W W1 1的相关那么显著(根据特征的相关那么显著(根据特征值的贡献率)。值的贡献率)。相关分析的冗余分
25、析相关分析的冗余分析 主要说明典型变量对各组观测变量总方主要说明典型变量对各组观测变量总方差的代表比例和解释比例。差的代表比例和解释比例。Variance in dependent variables explained by canonical variablesCAN.VARPct Var DECum Pct DEPct Var COCum Pct CO12341.45547.75310.79241.45589.208100.0041.07843.3534.38441.07884.43188.814相关分析的冗余分析相关分析的冗余分析 其中:其中:DE因变量组因变量组 CO协变量组协变量组
26、Variance in covariates variables explained by canonical variablesCAN.VARPct Var DECum Pct DEPct Var COCum Pct CO12371.69122.310 1.24971.69194.00195.25172.34924.575 3.07672.34996.924 100.00相关分析的冗余分析相关分析的冗余分析 解释比例解释比例=代表比例代表比例典型相关系数的平方典型相关系数的平方 对于因变量则有对于因变量则有:Var CO=Var DESq.Cor 41.078=41.4550.991 所以典
27、型相关系数高时,并不说明典型变所以典型相关系数高时,并不说明典型变量对观测组变量的解释程度高,代表程度量对观测组变量的解释程度高,代表程度高。高。相关分析的冗余分析相关分析的冗余分析 通过不同观察变量组的代表比例和解释通过不同观察变量组的代表比例和解释比例相乘,可以得到因变量组总方差与比例相乘,可以得到因变量组总方差与协变量组总方差的共享比例。即:协变量组总方差的共享比例。即:因变量组的因变量组的Var DE协变量组的协变量组的Var DE 或:因变量组的或:因变量组的Var CO协变量组的协变量组的Var CO 两个变量组的共享方差两个变量组的共享方差相关分析的冗余分析相关分析的冗余分析 第
28、一典型相关的共享方差为:第一典型相关的共享方差为:0.410780.72349=0.29720=29.720%第二典型相关的共享方差为:第二典型相关的共享方差为:0.433530.24575=0.10354=10.654%第三典型相关的共享方差为:第三典型相关的共享方差为:0.043840.03076=0.00135=0.135%例例2 2 康复训练康复训练 康复 俱乐 部对20名 中年 人测 量了 三个 生理 指标:体 重(X1),腰 围(X2),脉搏(X3);三个 训练 指标:引 体向上 次数(Y1),起坐 次数(Y2),跳 跃次 数(Y3)。分析生 理指 标与 训练 指标 的相 关性。数
29、 据见 下表2。27.1245.9646.587.2987.12288.818.27263.72332.4812,27.1287.2918.27245.9687.12263.72346.588.832.4821 02350784.000754531.000165941.000754531.042549329.0047214.000165941.0047214.000723237.0111 000727.00003747.00004126.000037.000071416.00040789.000041.00040789.00732399.0122 01728371.00138964.00575
30、041.07392212.090714323.0498811.404651367.00551887.02459454.021122121111M03208.04227509.00328274.0091339.054877371.004076171.0223085.003428439.216178831.012111211222M经计算得 求得特征值为:632994993.021,040214862.022,005267145.023。典型相关系数分别为:796.01,201.02,073.03。1M和2M相应的特征向量分别为:)1()008.0,493.0,031.0(a,)2()032.0,
31、369.0,076.0(a)3()146.0,158.0,008.0(a,)1()014.0,017.0,066.0(b)2()021.0,002.0,071.0(b,)3()008.0,020.0,245.0(b 根据前述的典型相关系数显著性检验方法,对于0:3210H,至少一个不为零:1H。350390621.0)005267145.01)(040214862.01)(632994993.01()-(131i2i0 255.16ln5.15ln)133(21)120(ln)1(21)1(ln00000qpnmQ 91896016.16)9(205.00Q,故在05.0下,生理指标与训练指标
32、之间不相关;而在10.0下,68366.14)9(210.00Q,生理指标与训练指标之间存在相关性,且第一对典型变量相关性显著。继续检验 954729811.0)005267145.0.01)(005267145.01)(040214862.01()-(132i2i1718.0ln5.15ln)133(21)120(ln)1(21)1(ln11111qpnmQ 779434.7)4(210.01Q,故在10.0下,第二对典型变量间相关性不显著。说明生理指标和训练指标之间只有一对典型变量,即 32113211014.0017.0066.0008.0493.0031.0YYYVXXXU 01728
33、372.00312927.00167929.03282724.09071432.058342554.015927699.04255619.02459454.02112212111*1RRRRM032080511.03463725.03184294.0111448282.05487737.048244159.0022998202.01718776.016178827.01211121122*2RRRRM)*1()059.0,579.1,775.0(a,)*2()231.0,181.1,884.1(a)*3()051.1,506.0,191.0(a,)*1()716.0,054.1,349.0(b
34、)*2()062.1,123.0,376.0(b,)*3()419.0,237.1,297.1(b 可得到标准化后的第一对典型变量)2(3)2(2)2(1*1)1(3)1(2)1(1*1716.0054.1349.0059.0579.17751.0ZZZVZZZU 其中,)1(iZ和)2(jZ分别为原始变量iX和jY标准化后的结果。以上结果说明生理指标的第一典型变量与体重的相关系数为-0.621,与腰围的相关系数为-0.925,与脉搏的相关系数为0.333。从另一方面说明生理指标的第一对典型变量与体重、腰围呈负相关,而与脉搏成正相关。其中与腰围的相关性最强。第一典型变量主要反映了体型的胖瘦。进
35、行 典型 冗余 分析,求 得生 理指 标样 本方 差由 自身3个 典型 变量 解释 的方 差比 例分 别为:0.6970.2460.451302.0)/30.9420.031(0.135=量解释解释的方差型第246.0)/30.0410.377(0.772=量解释解释的方差典型第451.0)/30.3330.925(0.621=量解释解释的方差第一典型222222222方差比例前两个典型变量解释的变三典变二变 例例3 3(科技经费投入科技经费投入.savsav)我国科技市场产出情况与我国科技市场产出情况与R&DR&D经费支出变量的经费支出变量的典型相关分析典型相关分析 “科学技术是第一生产力科
36、学技术是第一生产力”,近几年来,我国,近几年来,我国在科研方面的投入不断增加,国家的研究与试在科研方面的投入不断增加,国家的研究与试验发展(验发展(R&DR&D)经费内部支出到经费内部支出到20012001年已达到年已达到8956.68956.6亿元。那么,科技市场的产出情况是否亿元。那么,科技市场的产出情况是否与经费投入密切相关?各种类型的经费投入对与经费投入密切相关?各种类型的经费投入对科技市场的发展具体有怎样的影响?通过对科技市场的发展具体有怎样的影响?通过对R&DR&D各种项目的支出变量与科技市场在某些方各种项目的支出变量与科技市场在某些方面的产出变量做典型相关分析,找出两者之间面的产
37、出变量做典型相关分析,找出两者之间的联系。的联系。数据说明数据说明 R&DR&D经费投入变量包括三个:经费投入变量包括三个:基础研究的基础研究的R&DR&D经费支出、应用研究的经费支出、应用研究的R&DR&D经费支出经费支出和试验发展的和试验发展的R&DR&D经费支出经费支出(协变量)。(协变量)。科技市场产出变量也选择了三个,分别科技市场产出变量也选择了三个,分别为:为:新产品产值、专利授予量和科技市新产品产值、专利授予量和科技市场成交额场成交额(因变量)。(因变量)。资料来源于资料来源于20022002年年统计年鉴统计年鉴。使用使用SPSSSPSS进行典型相关分析进行典型相关分析 使用使用
38、MANOVAMANOVA进行典型相关分析。程序命进行典型相关分析。程序命令如下(令如下(syntax-manova12.2syntax-manova12.2):):MANOVA xch zhl chj WITH jch yy shy/DISCRIM ALL ALPHA(1)/PRINT=SIG(EIGEN DIM).主要结果的解释主要结果的解释 Test Name Value Approx.F Hypoth.DF Error DF Sig.of FPillais 1.86281 11.46653 9.00 63.00 .000Hotellings 13.36726 26.23943 9.00
39、53.00 .000Wilks .01533 23.53353 9.00 46.39 .000Roys .88531Multivariate Tests of Significance(S=3,M=-1/2,N=8 1/2)主要结果的解释主要结果的解释 Eigenvalues and Canonical Correlations Root No.Eigenvalue Pct.Cum.Pct.Canon Cor.Sq.Cor 1 7.719 57.746 57.746 .941 .885 2 5.497 41.122 98.868 .920 .846 3 .151 1.132 100.000 .
40、363 .131 维度递减检验维度递减检验Dimension Reduction AnalysisRootsWilks L.F HypothDFError DFSig.of F1 to 32 to 33 to 30.015330.133690.86858 23.53353 17.34940 3.17735 9.00 4.00 1.00 46.39 40.00 21.00 0.000 0.000 0.089Standardized canonical coefficients for DEPENDENT variables 可以得到典型变量可以得到典型变量V V 1 1、V V 2 2和和V V
41、 3 3对于标准化的变量对于标准化的变量xchxch,zhlzhl,chjchj的表示式。由前所示,前两对典型变的表示式。由前所示,前两对典型变量的累积百分比已达到量的累积百分比已达到98.868%,98.868%,所以我们主要看所以我们主要看V V 1 1和和V V 2 2的表达式:的表达式:V V 1 1=0.003xch+0.593zhl+0.566chj=0.003xch+0.593zhl+0.566chj V V 2 2=0.261xch=0.261xch0.834zhl-0.948chj0.834zhl-0.948chj Function No.Variable 1 2 3 XCH
42、 .003 .261 1.067 ZHL .593 .834 -.709 CHJ .566 -.948 .316 Correlations between DEPENDENT and canonical variables 从典型变量与科技投入变量组的相关系数也从典型变量与科技投入变量组的相关系数也能看出,能看出,V V 1 1主要代表专利授予量和科技市场主要代表专利授予量和科技市场成交量指标。成交量指标。Function No.Variable 1 2 3 XCH .325 .468 .822 ZHL .870 .479 -.119 CHJ .855 -.505 .121 Standardi
43、zed canonical coefficients for COVARIATES variables 典型变量典型变量W W 1 1、W W 2 2和和W W 3 3对科技投入组各变量的对科技投入组各变量的关系式见结果(关系式见结果(5 5)。)。W W 1 1 0.370jch-0.350yy+1.006shy0.370jch-0.350yy+1.006shy W W 2 2 0.334jch-1.092yy+1.034shy0.334jch-1.092yy+1.034shy Function No.Variable 1 2 3 JCH .370 -.334 -3.993 YY -.350
44、 -1.092 4.241 SHY 1.006 1.034 -.358 Correlations between COVARIATES and canonical variables 从从W W 1 1、W W 2 2和各投入变量的相关系数看,和各投入变量的相关系数看,这两个典型变量都与这两个典型变量都与“试验发展试验发展”变量变量关系紧密。关系紧密。Function No.Variable 1 2 3 JCH .689 -.714 -.127 YY .732 -.669 .124 SHY .996 .030 .090 典型相关分析的结果显示,我国科技市典型相关分析的结果显示,我国科技市场的产
45、出情况与场的产出情况与R&DR&D经费支出具有显著的经费支出具有显著的相关关系,相关关系,尤其是试验发展方面的尤其是试验发展方面的R&DR&D投入,对科技投入,对科技市场成交额和专利授予量方面的贡献比市场成交额和专利授予量方面的贡献比较大。较大。相关分析的冗余分析相关分析的冗余分析Variance in dependent variables explained by canonical variablesCAN.VARPct Var DECum Pct DEPct Var COCum Pct CO12353.07423.44023.48653.07476.514100.0046.98719.
46、8323.08646.98766.81969.906相关分析的冗余分析相关分析的冗余分析Variance in covariate variables explained by canonical variablesCAN.VARPct Var DECum Pct DEPct Var COCum Pct CO12359.08027.0310.17359.08086.11286.28566.73431.9491.31766.73498.683100.00 因变量组与协变量组的共享方差:因变量组与协变量组的共享方差:在第一典型相关上:在第一典型相关上:0.469870.66734=0.31356=31.356%在第二典型相关上:在第二典型相关上:0.198320.31949=0.06336=6.336%
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。