1、经济经济 管理类管理类 基础课程基础课程统计学统计学经济经济 管理类管理类 基础课程基础课程统计学统计学掌握单因素方差分析F检验的内容并理解多重比较的基本原理了解双因素方差分析的基本概念与原理掌握相关关系的概念、皮尔逊相关系数的估计和检验了解斯皮尔曼秩相关和肯德尔相关的原理经济经济 管理类管理类 基础课程基础课程统计学统计学掌握一元线性回归模型的基本概念、回归系数的最小二乘估计理解因变量与自变量之间线性关系的检验和回归系数的检验了解多元线性回归分析和逻辑斯蒂回归分析经济经济 管理类管理类 基础课程基础课程统计学统计学第第五五章章方方差差分分析析与与回回归归分分析析单因素方差分析单因素方差分析方
2、差分析的方差分析的F F检验检验方差分析的多重比较方差分析的多重比较多因素方差分析多因素方差分析无交互作用的双因素方差分析无交互作用的双因素方差分析有交互作用的双因素方差分析有交互作用的双因素方差分析相关分析相关分析皮尔逊相关系数皮尔逊相关系数斯皮尔曼秩相关系数斯皮尔曼秩相关系数肯德尔肯德尔相关系数相关系数回归分析回归分析一元线性相关分析一元线性相关分析多元线性相关分析多元线性相关分析逻辑斯蒂回归逻辑斯蒂回归经济经济 管理类管理类 基础课程基础课程统计学统计学经济经济 管理类管理类 基础课程基础课程统计学统计学方差分析(Analysis of Variance;ANOVA)是费希尔(R.A.F
3、isher)在分析生物和农业实验数据时提出来的,通过检验多个总体均值是否相等,来判断一个或多个分类型变量对某一关心的数值型变量是否有影响。数值型变量被称为因变量,分类型自变量被称为“因素”或“因子”,因素的不同状态被称为水平或处理经济经济 管理类管理类 基础课程基础课程统计学统计学进行方差分析需要满足三个基本假定:(1)每个因素水平组合下的观测或实验数据服从正态分布(2)正态分布的方差是相等的(3)观测或实验数据相互独立,即这些观测或实验时是互不干扰、独立进行的经济经济 管理类管理类 基础课程基础课程统计学统计学按照所研究的因素个数的不同:方差分析单因素方差分析多因素方差分析经济经济 管理类管
4、理类 基础课程基础课程统计学统计学记因素为A,它有k个水平:在每个水平 下有数据 这里 ,并且不要求每个水平下的数据量 相等,总样本量记为 在数据满足三个基本假定的前提下,所谓的“因素没有影响”就意味着每个水平下的总体均值是相等的,“因素有影响”就意味着这些均值必然不全相等。经济经济 管理类管理类 基础课程基础课程统计学统计学因此,方差分析实际上就是要对如下的原假设与备择假设进行假设检验:经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-1 5-1 单因素方差分析的数据结构单因素方差分析的数据结构经济经济 管理类管理类 基础课程基础课程统计学统计学基于表5-1的数据,可有如下定义:总
5、离差平方和组间离差平方和211inkijijSSTxx22111inkkiiiijiSSAxxnxx经济经济 管理类管理类 基础课程基础课程统计学统计学组内离差平方和其中 为第i 个水平下的样本平均数,为总样本平均数。211inkijiijSSExx11iniijjixxn111inkijijxxn经济经济 管理类管理类 基础课程基础课程统计学统计学可以证明:其中:SST反映了因变量全部观测值的总变动 SSA反映了样本均值不同水平之间的差异程度,它一般有两个方面的来源,一是由于因素取不同水平所导致的因变量取不同值的影响,即系统因素,二是随机误差的影响 SSE反映的是每一因素水平下样本内各个观测
6、值的变动程度,它源于随机误差的影响。SSTSSASSE经济经济 管理类管理类 基础课程基础课程统计学统计学定义 它近似反映了在因变量的总变动中可以由因素解释的部分所占的比例,是一种对因素与因变量之间的关系强度的测量2=SSARSST经济经济 管理类管理类 基础课程基础课程统计学统计学可以证明,在原假设成立的条件下,下面的统计量服从自由度为 的 分布,即上式中k-1,n-k分别是组间离差平方和与组内离差平方和的自由度(1,)knkF1(1,)SSA kMSAFF knkSSE nkMSE:经济经济 管理类管理类 基础课程基础课程统计学统计学在原假设成立的情况下,由于因素的不同水平对于因变量的取值
7、没有影响,那么组间离差平方和中就只包含随机误差的影响而没有系统误差的影响,这时组间均方误差MSA(组间离差平方和除以它的自由度k-1)与组内均方误差MSE(组内离差平方和除以它的自由度n-k)就应该很接近,它们的比值就会接近1经济经济 管理类管理类 基础课程基础课程统计学统计学如果原假设不成立,即因素的不同水平对于因变量的取值有显著影响,那么组间离差平方和中除了包含随机误差的影响外,还会受到系统误差的影响,这时组间均方误差MSA就会大于组内均方误差MSE,它们的比值就会大于1。当这个比值大到某种程度时,根据小概率事件原理,就认为因素的不同水平对因变量的取值有显著影响,即自变量对因变量有显著影响
8、。经济经济 管理类管理类 基础课程基础课程统计学统计学做统计判断时,可以利用样本数据计算检验统计量的具体值,然后计算该具体值所对应的p值,用p值与给定的显著性水平 的大小进行比较来决策,若 时,就拒绝原假设,否则不拒绝。或者根据所给定的显著性水平 计算相应的临界值 ,然后比较其与检验统计量的具体值F的大小进行判断,若 时,就拒绝原假设,否则不拒绝。pFFF经济经济 管理类管理类 基础课程基础课程统计学统计学多重比较方法是通过对各水平下总体均值之间的配对比较来进一步检验到底是哪些水平之间存在差异。多重比较的方法很多,常用的有最小显著差异法(Least Significant Difference
9、;LSD)、Bonferroni法、Scheffe法、Tukey法、Duncan多重区域检验法等,这里仅介绍LSD经济经济 管理类管理类 基础课程基础课程统计学统计学第一步:提出原假设与备择假设 第二步:计算具体的 的值;01:ijijHHijxx经济经济 管理类管理类 基础课程基础课程统计学统计学第三步:计算LSD,其公式为 是自由度为 的t分布的临界值 是给定的显著性水平第四步:进行决策,如果 则拒绝 ;否则不拒绝 211ijL S DtM S EnnnkijxxLSD0H2t0H经济经济 管理类管理类 基础课程基础课程统计学统计学一家管理咨询公司为不同的客户举办人力资源讲座。每次讲座的内
10、容基本上是一样的,但讲座的听课者有时是高级管理者,有时是中级管理者,有时是初级管理者。该咨询公司认为,不同层次的管理者对讲座的满意度可能存在差异。听完讲座后随机抽取不同层次的管理者的满意度评分如表5-2所示(评分标准为1-10,10代表非常满意):经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-25-2 不同层次管理者的满意度不同层次管理者的满意度高级管理者中级管理者初级管理者77879898109108565748经济经济 管理类管理类 基础课程基础课程统计学统计学(1)建立原假设与备择假设(2)计算有关的均值及离差平方和01231123:,HH 不全相等试据此检验管理者的层次不
11、同是否会导致评分的显著差异,如果是,究竟存在于哪些层次之间(取显著性水平 )0.05经济经济 管理类管理类 基础课程基础课程统计学统计学123222222222222778797.6,8.857,5.833,7.5577.577.5+87.548.50077.677.6+97.688.85798.857+88.85755.83365.833+85.83318.890 xxxxSSTSSE22257.6 7.578.857 7.565.833 7.529.610SSA 经济经济 管理类管理类 基础课程基础课程统计学统计学(3)列出方差分析表表表5-35-3 方差分析表方差分析表方差来源离差平方和
12、S自由度df均方MSF组间29.610214.80511.756组内18.890151.259总计48.50017经济经济 管理类管理类 基础课程基础课程统计学统计学(4)统计决策对显著性水平 ,能够得到 由于检验统计量 所以拒绝原假设,即有95%的把握认为不同层次的管理者对讲座的满意度是不同的。当然也可以通过比较p值与显著性水平 的大小来决策,在这里可以计算出p值为0.001,它远远小于0.05,因此决策结果同样是拒绝原假设。=0.050.05(2,15)3.682F11.7563.682F 经济经济 管理类管理类 基础课程基础课程统计学统计学(5)多重比较拒绝了原假设,说明管理者层次对讲座
13、的满意度得分确实存在显著性差异,但具体是哪些水平之间存在差异,还需要进行多重比较才能判断。由题意及计算可知:1231235,7,6,7.6,8.857,5.833nnnxxx经济经济 管理类管理类 基础课程基础课程统计学统计学(5)多重比较第一步:提出假设第二步:计算检验统计量的值0121120231230131131:HHHHHH假设假设2假设31223137.68.8571.2578.8575.8333.0247.65.8331.767xxxxxx经济经济 管理类管理类 基础课程基础课程统计学统计学(5)多重比较第三步:计算LSD由表5-3可知,MSE=1.259,又知道 ,得到下面LSD
14、值0.025(15)2.131t123112.1311.2591.40057112.1311.2591.33076112.1311.2591.44856LSDLSDLSD经济经济 管理类管理类 基础课程基础课程统计学统计学(5)多重比较第四步:进行决策由以上计算可知,显示中级管理者与初级管理者之间以及高级管理者与初级管理者之间的差异显著,但高级管理者与中级管理者之间的差异在统计上不显著。121232133,x xLSD xxLSD x xLSD经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(1)选择菜单“分析(A)比较均值(M)单因素(ANOVA)”,于是出现图5-1所
15、示的主对话框;(2)选择“满意度得分”到“因变量列表(E)“框,选择“所属管理层次”到“因子(F)”框;经济经济 管理类管理类 基础课程基础课程统计学统计学图图5-1 5-1 单因素方差分析主对话框单因素方差分析主对话框经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(3)单击“两两比较(H)”按钮,打开两级对话框如图5-2所示,勾中复选框“LSD(L)”,然后点击按钮“继续”回到原窗口。经济经济 管理类管理类 基础课程基础课程统计学统计学图图5-2 5-2 两两比较对话框两两比较对话框经济经济 管理类管理类 基础课程基础课程统计学统计学(4)单击“确定”按钮,SPSS的
16、输出结果如表5-4和表5-5所示。表表5-4 5-4 满意度得分的方差分析表满意度得分的方差分析表平方和自由度df均方F显著性组间29.610214.80511.756.001组内18.890151.259总数48.50017经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-5 5-5 满意度得分的多重比较满意度得分的多重比较(I)所属管理层次(J)所属管理层次均值差(I-J)标准误显著性95%置信区间下限上限高级中级-1.257.657.075-2.66.14初级1.767*.680.020.323.22中级高级1.257.657.075-.142.66初级3.024*.624.0
17、001.694.35初级高级-1.767*.680.020-3.22-.32中级-3.024*.624.000-4.35-1.69*意味着结果显著 经济经济 管理类管理类 基础课程基础课程统计学统计学经济经济 管理类管理类 基础课程基础课程统计学统计学经济经济 管理类管理类 基础课程基础课程统计学统计学单因素方差分析只考虑一个因素对因变量的影响,它可以进一步拓展为多因素方差分析。双因素方差分析是多因素方差分析最简单的一种情形,它旨在判断两个因素中某一个或两个因素对因变量是否有显著影响,以及两个因素的不同搭配是否有新效应。经济经济 管理类管理类 基础课程基础课程统计学统计学记某一因素为A,它有r
18、个水平记另一个因素为B,它有s个水平因变量记为X研究的目的:要分析因素A和因素B对因变量X取值的影响12,rA AA12,sB BB经济经济 管理类管理类 基础课程基础课程统计学统计学如果因素A和因素B对因变量X取值的影响是相互独立的,这时只需分别判断这两个因素的影响,这被称为无交互作用的双因素方差分析如果这两个因素的影响不是相互独立的,也就是说两个因素互相搭配的效果会对因变量X的取值产生一种新的影响,也就是说两个因素有交互效应,就称之为有交互作用的双因素方差分析经济经济 管理类管理类 基础课程基础课程统计学统计学在A的r个水平和B的s个水平的每一种组合下做一次观测或试验,可以得到无交互作用的
19、双因素方差分析的数据结构,如表5-6所示。如果在每一组合下做两次以上的观测或试验,就能进一步考察交互作用了。经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-6 5-6 无交互作用双因素方差分析的数据结构无交互作用双因素方差分析的数据结构经济经济 管理类管理类 基础课程基础课程统计学统计学在表5-6中:111,2,siijjxxirsgK各行均值111,2,rjijixxjsrgK各列均值111rsijijxxrs总均值经济经济 管理类管理类 基础课程基础课程统计学统计学对于无交互作用的双因素方差分析,其分析原理与单因素方差分析相同。判断因素A的影响是否显著等价于检验原假设:判断因素
20、B的影响是否显著等价于检验原假设:其中 表示A的第i个水平构成的总体的均值;表示B的第j个水平构成的总体的均值。0112:rHgggL0212:sHgggLij经济经济 管理类管理类 基础课程基础课程统计学统计学为了检验这些假设,同样需要对总离差平方和SST进行分解,可以证明其中SSTSSASSE211rsijijSSTxx22111rsriiijiSSAxxsxxgg经济经济 管理类管理类 基础课程基础课程统计学统计学22111rssjjijjSSBxxrxxgg211rsijijijSSExxxxgg经济经济 管理类管理类 基础课程基础课程统计学统计学SSA主要反映了因素A的不同水平引起的
21、因变量的变动,如果因素A各水平之间没有差异,SSA仅仅反映了随机误差的纯效应SSB主要反映了因素B的不同水平引起的变动,如果因素B各水平之间没有差异,SSB也仅仅反映了随机误差的纯效应;SSE中只有数据随机误差效应的影响。经济经济 管理类管理类 基础课程基础课程统计学统计学在一定条件下,可以证明在原假设 成立的条件下0112:rHgggL1,(1)(1)AAESSA fFF rrsSSE f:经济经济 管理类管理类 基础课程基础课程统计学统计学在原假设 成立的条件下0212:sHgggL1,(1)(1)BBESSB fFF srsSSE f:上列式子中,和 分别是SSA、SSB和SSE的自由度
22、,可以利用上面两个表达式作为检验统计量。,ABffEf经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-7 5-7 无交互作用的双因素方差分析表无交互作用的双因素方差分析表方差来源平方和S自由度df均方MSF值因素ASSAr-1MSA=SSA/(r-1)MSA/MSE因素BSSBs-1MSB=SSB/(s-1)MSB/MSE随机误差SSE(r-1)(s-1)MSE=SSE/(r-1)(s-1)总计SSTrs-1经济经济 管理类管理类 基础课程基础课程统计学统计学为研究食品的包装方法和销售部门对其销量是否有影响,在三个销售部门用三种不同包装进行销售,获得的销量数据如下,取显著性水平为0
23、.05,检验不同的销售部门和不同的包装方法对该食品的销量是否有显著影响。经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-7 5-7 无交互作用的双因素方差分析表无交互作用的双因素方差分析表销售部门(A)包装方法(B)盒装袋装散装一部二部三部420480530228245270347369412经济经济 管理类管理类 基础课程基础课程统计学统计学(1)建立原假设(2)计算相应的离差平方和0112302123:HH和3321188189.56ijijSSTxx经济经济 管理类管理类 基础课程基础课程统计学统计学32137868.22iiSSAxx321379044.22jjSSBxx3
24、32111277.11ijijijSSExxxx经济经济 管理类管理类 基础课程基础课程统计学统计学(3)列出方差分析表方差来源平方和SS自由度df均方MSF值因素A7868.2223934.1112.32因素B79044.22239522.11123.79随机误差1277.114319.28总计88189.568表表5-9 5-9 方差分析表方差分析表经济经济 管理类管理类 基础课程基础课程统计学统计学(4)统计判断对于显著性水平0.05,能够查表或用软件得到临界值 因为由此可以判断,销售部门和包装方法对于销售量的影响均是显著的。0.05(2,4)6.94F。010212.326.94123
25、.796.94,ABFHFH,拒绝拒绝经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(1)选择菜单“分析(A)一般线性模型(G)单变量(U)”,就会出现如图5-3所示的窗口。选择“销售量”到“因变量(D)”框,选择“销售部门”和“包装方法”到“固定因子(F)”框。经济经济 管理类管理类 基础课程基础课程统计学统计学图图5-3 5-3 双因素方差分析主对话框双因素方差分析主对话框经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(2)点击“模型(M)”按钮,打开如图5-4所示的对话框,“指定模型”选择“设定(C)”,然后设定模型结构:把“因子与协变量(
26、F)”中的因素列表选入“模型(M)”框,“构建项”选择“主效应”;“平方和(Q)”选择“类型III”,勾中复选框“在模型中包含截距(I)”,具体见图5-4。经济经济 管理类管理类 基础课程基础课程统计学统计学图图5-4 5-4 模型设定对话框模型设定对话框经济经济 管理类管理类 基础课程基础课程统计学统计学(3)点击“继续”回到图5-3的窗口,点击“确定”即可得到最终的输出结果,整理后见表5-10。表表5-10 5-10 销售量的无交互作用的双因素方差分析表销售量的无交互作用的双因素方差分析表源III 型平方和df均方FSig.校正模型86912.444421728.11168.054.001
27、截距1210733.44411210733.4443792.101.000销售部门7868.22223934.11112.322.020包装方法79044.222239522.111123.786.000误差1277.1114319.278总计1298923.0009校正的总计88189.5568经济经济 管理类管理类 基础课程基础课程统计学统计学由上表可以看出,因素A对应的p值为0.020(实际为0.01951),因素B对应的p值为0.000(实际为0.00025),通过与显著性水平0.05比较,两者都小于0.05,均拒绝原假设,同样得到了销售部门和包装方法对于销售量的影响均是显著的结论。经
28、济经济 管理类管理类 基础课程基础课程统计学统计学交互作用,就是两个因素对观测或试验数据值的影响效应不是简单的叠加,而是跟具体的搭配方式有关。这个时候共要做三个检验:判断因素A对因变量X是否有显著影响,判断因素B对因变量X是否有显著影响,判断因素A和因素B的交互作用对因变量X是否有显著影响。经济经济 管理类管理类 基础课程基础课程统计学统计学为了能分辨出两个因素的交互作用,要求每一个水平组合下至少取得两个数据值。设两个影响因素为A和B,分别有r和s个水平,在每一个水平组合下取得t个数据值(t可以不等,为简单起见假设是相等的),从而可以得到如表5-11的数据结构。经济经济 管理类管理类 基础课程
29、基础课程统计学统计学表表5-11 5-11 有交互作用的双因素方差分析数据结构有交互作用的双因素方差分析数据结构经济经济 管理类管理类 基础课程基础课程统计学统计学三个检验的原假设分别是:在这里因素A和因素B的每一种搭配组合都是一个总体,因此共有rs个总体,每一种搭配组合比如 下的数据值是随机样本,其期望值为 。010203:HAHBHAB因素 的影响是不显著的因素 的影响是不显著的因素 与 的交互作用是不显著的ijAB和ij经济经济 管理类管理类 基础课程基础课程统计学统计学定义:同样,首先建立样本数据的方差分解恒等式其中1111111,srrsiijjijijjiijsrrsSSTSSAS
30、SBSSABSSE2111rstijkijkSSTxx经济经济 管理类管理类 基础课程基础课程统计学统计学2111rstiijkSSAxx2111rstjijkSSBxx 2111rstijijijkSSABxxxx 2111rstijkijijkSSExx经济经济 管理类管理类 基础课程基础课程统计学统计学上面式中各种样本平均数的定义分别为1111rstijkijkxxrst样本总平均数11tijijijkkABxxt和搭配组合的样本平均数111stiijkjkAixxst因素第个水平的样本平均数111rtjijkikBjxxrt 因素第 个水平的样本平均数经济经济 管理类管理类 基础课程基
31、础课程统计学统计学针对前面的三个原假设可建立下面的检验统计量:0111:1,(1)(1)ASSA rMSAHFF rrs tSSErs tMSE()针对0212:1,(1)(1)BSSBsMSBHFF srs tSSErs tMSE()针对03(1)(1)3:(1)(1),(1)(1)ABSSAB rsMSABHFF rsrs tSSE rs tMSE()针 对经济经济 管理类管理类 基础课程基础课程统计学统计学方差来源平方和SS自由度df均方MSF值因素ASSAr-1MSA=SSA/(r-1)MSA/MSE因素BSSBs-1MSB=SSB/(s-1)MSB/MSE因素ABSSAB(r-1)(
32、s-1)MSAB=SSAB/(r-1)(s-1)MSAB/MSE随机误差SSErs(t-1)MSE=SSE/rs(t-1)总计SSTrst-1表表5-12 5-12 有交互作用的双因素方差分析表有交互作用的双因素方差分析表经济经济 管理类管理类 基础课程基础课程统计学统计学用两种不同的教学方法和三种不同的教材在6个小班进行英语口语教学试验,在每个小班随机抽取3人,共抽取18人进行测验,得到他们的成绩如表5-13所示,判断教材、教学方法及它们的交互作用对成绩的影响是否显著()。0.05经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-13 5-13 教学方法与教材的交互作用教学方法与教
33、材的交互作用教学方法(A)教材(B)教材一教材二教材三教学方法一教学方法二64、67、7075、73、7488、86、9284、82、8390、92、8785、83、89经济经济 管理类管理类 基础课程基础课程统计学统计学(1)建立原假设(2)计算相应的离差平方和01120212303:0,ijijHHHi j对任意的2111=1284.000rstijkijkSSTxx经济经济 管理类管理类 基础课程基础课程统计学统计学(2)计算相应的离差平方和2111=3.556rstiijkSSAxx2111=1066.333rstjijkSSBxx 2111=142.111rstijijijkSSAB
34、xxxx 2111=72.000rstijkijijkSSExx经济经济 管理类管理类 基础课程基础课程统计学统计学(3)列出方差分析表表表5-14 5-14 方差分析表方差分析表方差来源平方和SS自由度df均方MSF值因素A3.55613.5560.593因素B1066.3332533.16788.861因素AB142.111271.05611.843随机误差72.000126.000总计1284.00017经济经济 管理类管理类 基础课程基础课程统计学统计学(4)统计判断对于显著性水平0.05,能够查表或用软件得到临界值 因为由此得到的结论是,因素A也即教学方法的效应是不显著的,因素B也即
35、教材自身的主效应及它与教学方法的交互效应对于成绩的影响均是显著的0102030.5934.74788.8613.885,11.8433.885,ABABFHFHFH,不拒绝拒绝拒绝0.050.05(1,12)4.747(2,12)3.885FF,经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(1)选择菜单“分析(A)一般线性模型(G)单变量(U)”,就会出现如图5-5所示的窗口。选择“成绩”到“因变量(D)”框,选择“教材”和“方法”到“固定因子(F)”框。经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(2)点击“模型(M)”按钮,打开如图5-6
36、所示的对话框,“指定模型”选择“全因子(A)”、“平方和(Q)”选择“类型III”,勾中复选框“在模型中包含截距(I)”经济经济 管理类管理类 基础课程基础课程统计学统计学图图5-3 5-3 双因素方差分析主对话框双因素方差分析主对话框经济经济 管理类管理类 基础课程基础课程统计学统计学图图5-4 5-4 模型设定对话框模型设定对话框经济经济 管理类管理类 基础课程基础课程统计学统计学(3)点击“继续”回到图5-5的窗口,点击“确定”得到最终的输出结果。表表5-15 5-15 成绩的有交互作用的双因素方差分析表成绩的有交互作用的双因素方差分析表源III 型平方和df均方FSig.校正模型121
37、2.0005242.40040.400.000截距119072.0001119072.00019845.333.000教材1066.3332533.16788.861.000教学方法3.55613.556.593.456教材*教学方法142.111271.05611.843.001误差72.000126.000总计120356.00018校正的总计1284.00017经济经济 管理类管理类 基础课程基础课程统计学统计学由上表可以看出,因素A(教学方法)对应的p值为0.456,因素B(教材)对应的p值接近于0,因素A与因素B的交互作用对应的p值为0.001,通过与显著性水平0.05比较,得到与前
38、述相同的结论,即因素A(教学方法)的影响是不显著的,因素B(教材)自身的影响以及它与教学方法的交互效应对于成绩的影响均是显著的。经济经济 管理类管理类 基础课程基础课程统计学统计学经济经济 管理类管理类 基础课程基础课程统计学统计学经济经济 管理类管理类 基础课程基础课程统计学统计学现实世界的现象之间都是相互联系的,这些联系可以概括为三类,即函数关系、相关关系和相互独立关系。函数关系是指变量之间存在的严格确定的依赖关系相关关系是指变量之间客观存在的非严格确定的依赖关系独立关系也称为不相关关系,意指变量间的取值互不影响,没有联系(一)相关关系的概念经济经济 管理类管理类 基础课程基础课程统计学统
39、计学相关关系可以从不同的角度加以分类:1按变量的多少可分为单相关、复相关和偏相关单相关是指一个变量与另一个变量之间的相关关系复相关则是指一个变量与两个或两个以上变量之间的相关关系(二)相关关系的分类经济经济 管理类管理类 基础课程基础课程统计学统计学单相关按变量间的相关方向不同又可分为正相关和负相关。当一个变量的数值由小变大时,另一个变量的数值也相应地由小变大,则称这种相关为正相关当一个变量的数值由小变大,另一个变量的数值却相应地由大变小,则这两个变量间的相关关系称为负相关(二)相关关系的分类经济经济 管理类管理类 基础课程基础课程统计学统计学现实中的变量之间的关系很复杂,一个变量的变化可能受
40、到不止一个变量的影响,单相关一般不能够真实地反映出两个变量之间的相关性,这个时候就要进一步开展偏相关分析它是当研究某一个变量对另一个变量的影响程度时,将其它变量的影响视作常数,即暂时不考虑其它变量的影响,单独研究两个变量之间的相互联系的程度。(二)相关关系的分类经济经济 管理类管理类 基础课程基础课程统计学统计学2按变量间相关的表现形式可分为线性相关和非线性相关若一个变量与另一个或一组变量之间的关系显著呈现某种线性组合时,称之为线性相关若一个变量与另一个或一组变量之间的关系并不表现为直线关系,而是大致表现为曲线、曲面或更复杂的形式时,称这种相关关系为非线性相关(二)相关关系的分类经济经济 管理
41、类管理类 基础课程基础课程统计学统计学3按变量间相关的密切程度可分为完全相关、不完全相关和不相关若一个变量的值完全由另一个或一组变量的值所决定,则称变量之间的这种相关关系为完全相关,即函数关系。若一个变量的值与另一个或一组变量的值有关,但并不能由其完全确定,还受随机因素的影响,则称变量之间的这种相关关系为不完全相关。(二)相关关系的分类经济经济 管理类管理类 基础课程基础课程统计学统计学3按变量间相关的密切程度可分为完全相关、不完全相关和不相关若一个变量的值完全不受另一个或一组变量值的影响,则称变量之间不相关,即相互独立。大量社会经济现象之间的相关关系都属于不完全相关,不完全相关是相关分析的基
42、本内容,完全相关和不相关可视为相关关系中的特例。(二)相关关系的分类经济经济 管理类管理类 基础课程基础课程统计学统计学刻画变量之间相关关系的方法较多,常用的有相关图和相关系数。相关图能够反映变量之间相关的形式和密切程度,其优点是形象直观,但不够精确相关系数提供了一套对变量之间线性相关的方向和密切程度进行刻画的完整的统计分析框架,包括对相关程度的估计和假设检验,以及对相关关系的数学形式进行描述。(三)相关关系的研究方法经济经济 管理类管理类 基础课程基础课程统计学统计学关系数测定方法与变量的数据类型有关对于数值型变量,通常采用皮尔逊相关系数进行测定;对于定序变量,通常采用斯皮尔曼秩相关系数或肯
43、德尔相关系数进行测定;对于定类变量,通常采用列联系数进行测定。(三)相关关系的研究方法经济经济 管理类管理类 基础课程基础课程统计学统计学相关图又叫散点图它是以直角坐标系的横轴代表某一变量X,纵轴代表另一变量Y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的状态。经济经济 管理类管理类 基础课程基础课程统计学统计学常见的相关关系示意图(a)完全正线性相关(b)完全负线性相关(c)正线性相关(d)负线性相关(e)非线性相关(f)不相关经济经济 管理类管理类 基础课程基础课程统计学统计学1皮尔逊相关系数的概念皮尔逊相关系数用于对两个数值型变量的线性相关程度进行度量,
44、是一种定量刻画变量间相关关系的方法。总体相关系数:总体相关系数一般是未知的2=X YXY经济经济 管理类管理类 基础课程基础课程统计学统计学根据样本数据计算总体相关系数的估计值,称之为样本相关系数,记为r。设样本 是总体 的大小为n的样本观测值,两个变量之间的样本相关系数的计算公式如下:,1,2,iix yin,X Y21111222222111111=nnnniii iiixyiiiinnnnnnxyiiiiiiiiiiiix x y yn xyxysrs sx xy yn xxnyy 经济经济 管理类管理类 基础课程基础课程统计学统计学式中:2111nxyiiisxxyyXYn为 和 的样
45、本协方差2111nxiisxxXn为 的样本标准差2111nyiisyyYn为 的样本标准差11,nniiiixyxyXYnn为 和 的样本平均数经济经济 管理类管理类 基础课程基础课程统计学统计学2相关系数的性质(1)r的取值在-1与1之间,当 时表示正相关,当 时表示负相关。(2)当 时表示X与Y的样本观测值之间完全正线性相关;当 时表示X与Y的样本观测值之间完全负线性相关;当 时,表示X与Y的样本观测值之间没有线性相关关系,但不表示没有相关关系。0r 0r=1r1r =0r经济经济 管理类管理类 基础课程基础课程统计学统计学2相关系数的性质(3)越趋近于1说明X与Y的样本观测值之间 线性
46、相关关系越强 越趋近于0说明X与Y的样本观测值之间 线性相关关系越弱。rr经济经济 管理类管理类 基础课程基础课程统计学统计学2相关系数的性质对于样本相关系数r,可以根据经验分为以下几种情况:当 时,可视为高度相关当 时,可视为中等程度的相关当 时,视为低度相关而当 时,就说明两个变量之间相关程度极弱,可以视为几乎不存在线性相关关系了。0.8r 0.50.8r0.30.5r0.3r 经济经济 管理类管理类 基础课程基础课程统计学统计学3相关系数的显著性检验样本相关系数r是根据样本数据计算出来的,会受到抽样误差的影响,因此在估计出样本相关系数后,还需要对它的显著性做假设检验。如果样本数据服从二元
47、正态分布,可以采用t检验方法,其原假设和备择假设分别为 检验统计量为 01:0:0HH2221ntrt nr经济经济 管理类管理类 基础课程基础课程统计学统计学为研究在统计学期末考试之前用于复习的时间和考试分数之间是否存在相关关系,一位研究者随机抽取了某高校的8名学生进行跟踪调查,得到的数据如表5-16所示,假设学生的复习时间与考试分数服从二元正态分布,请做出分析。这里的显著性水平为0.05。经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-16 85-16 8名学生的复习时间(单位:小时)与考试分数(单位:分)名学生的复习时间(单位:小时)与考试分数(单位:分)复习时间201634
48、2327321822考试分数6461847088927277经济经济 管理类管理类 基础课程基础课程统计学统计学(1)根据数据做出相关图,在SPSS中选择菜单“图形(G)散点/点状(S)”,在打开的对话框中把“考试分数”选入“Y轴”、把“复习时间”选入“X轴”,然后点击“确定”按钮,得到的相关图如图5-8所示经济经济 管理类管理类 基础课程基础课程统计学统计学由图可知复习时间与考试分数之间有一定的正相关性。图图5-8 5-8 学生的复习时间与考试分数相关图学生的复习时间与考试分数相关图经济经济 管理类管理类 基础课程基础课程统计学统计学(2)计算复习时间与考试分数的样本相关系数表表5-17 5
49、-17 样本相关系数计算表样本相关系数计算表经济经济 管理类管理类 基础课程基础课程统计学统计学将上表的合计数据代入公式即得228 15032 192 6080.8628 4902 1928 47094 608r经济经济 管理类管理类 基础课程基础课程统计学统计学(3)检验原假设与备择假设由于显著性水平值0.05对应的临界值是2.447,10.21远远大于2.447,因此,可以认为复习时间与考试成绩之间的线性相关关系是显著的。01:0:0HH20.862 8210.211 0.862t经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(1)选择菜单“分析(A)相关(C)双变
50、量(B)”,出现图5-9所示的窗口。把”复习时间”与”考试分数”选入”变量(V)”框;相关系数框根据需要勾选相应的相关度量方法,本例勾选了复选框“Pearson”;显著性检验选择了“双尾检验”经济经济 管理类管理类 基础课程基础课程统计学统计学图图5-9 5-9 相关系数对话框相关系数对话框经济经济 管理类管理类 基础课程基础课程统计学统计学具体操作步骤如下:(2)点击“确定”得到输出结果,如表5-18所示。表中显示了皮尔逊相关系数的样本估计值及相应的双侧检验的p值。经济经济 管理类管理类 基础课程基础课程统计学统计学表表5-18 5-18 皮尔逊相关系数及检验表皮尔逊相关系数及检验表同样可得