1、哈工程经济管理学院返回到目录-2-哈工程经济管理学院第三章第三章 多元线性回归模型的统计多元线性回归模型的统计检验与区间估计检验与区间估计3.1拟合优度检验拟合优度检验(R检验检验)3.2方程方程显著性检验显著性检验(F检验检验)3.3变量变量显著性检验显著性检验(t检验检验)-3-哈工程经济管理学院计计量量经经济济学学模模型型是是应应用用数数理理统统计计方方法法建建立立的的一一类类经经济济数数学学模模型型,模模型型必必须须满满足足数数学学理理论论与与方方法法上上的的要要求求,所所以以在在模模型型参参数数估估计计后后,需需要要检检验验其其是是否否满满足足数数学学理理论论与与方方法法上上的的要要
2、求求。-4-哈工程经济管理学院 我们所要进行的统计检验包括两个方我们所要进行的统计检验包括两个方面,一方面检验回归方程对样本数据的面,一方面检验回归方程对样本数据的拟合程度,通过可决系数来分析;另一拟合程度,通过可决系数来分析;另一方面检验回归方程的显著性,方面检验回归方程的显著性,通过假设通过假设检验检验对模型中被解释变量与解释变量之对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作间的线性关系在总体上是否显著成立作出推断出推断,包括对回归方程线性关系的检包括对回归方程线性关系的检验和对回归系数显著性的检验。验和对回归系数显著性的检验。-5-哈工程经济管理学院3.1拟合优度检验
3、拟合优度检验(R检验检验)Testing the Simulation Level-6-哈工程经济管理学院 拟合优度检验,顾名思拟合优度检验,顾名思义,是检验模型对样本观测义,是检验模型对样本观测值的拟合程度。值的拟合程度。-7-哈工程经济管理学院1、总体平方和、残差平方和和回归平方和、总体平方和、残差平方和和回归平方和 TSS TSS为总体平方和为总体平方和(Total Sum of SquaresTotal Sum of Squares),反,反映样本观测值总体离差的大小;映样本观测值总体离差的大小;ESSESS为回归平方和为回归平方和(Explained Sum of SquaresEx
4、plained Sum of Squares),反映由模型中,反映由模型中解释变量所解释的那部分离差的大小;解释变量所解释的那部分离差的大小;RSSRSS为残差为残差平方和平方和(Residual Sum of SquaresResidual Sum of Squares),反映样本,反映样本观测值与估计值偏离的大小,也是模型中解释变观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。量未解释的那部分离差的大小。TSS=RSS+ESS 222)()()(iiiiYYRSSYYESSYYTSS-8-哈工程经济管理学院 2 2、拟合优度检验统计量:、拟合优度检验统计量:可决系数可
5、决系数R2和校正可决系数和校正可决系数 (1)可决系数)可决系数 用可决系数用可决系数2R进行拟合优度检验,进行拟合优度检验,可决系可决系数的计算公式为:数的计算公式为:222YYYYRii ,该统计量越接近于,该统计量越接近于 1,模型,模型的拟合优度越高。的拟合优度越高。2R102 R-9-哈工程经济管理学院-10-哈工程经济管理学院22RR2R)1()1(1122RknnR(2)校正可决系数)校正可决系数)(1()(1(12YnYYknYXBYYn-11-哈工程经济管理学院3.2方程显著性检验方程显著性检验(F检验检验)Testing the Overall Significance-1
6、2-哈工程经济管理学院F F检验的思想检验的思想来自于总离差平方和的分解式:TSS=ESS+RSS由于回归平方和ESS是解释变量X联合体对被解释变量Y的线性作用的结果,所以,如果ESS/RSS的比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。因此因此,可通过该比值的大小对总体线性关系进可通过该比值的大小对总体线性关系进行推断行推断。1 1、F F检验的思想检验的思想-13-哈工程经济管理学院由于iY服从正态分布,根据数理统计学中的定义,iY的一组样本的平方和服从2分布。所以有:2)(YYESSi2()k 2)(iiYYRSS21()nk即回归平方和
7、、残差平方和分别服从自由度为k和()nk1的2分布。进一步根据数理统计学中的定义,如果构造一个统计量 FE S SkR S Snk()1则该统计量服从自由度为(k,n-k-1)的F分布。-14-哈工程经济管理学院2.2.关于假设检验关于假设检验 假设检验是统计推断的一个主要内容,它的基本假设检验是统计推断的一个主要内容,它的基本任务是根据样本所提供的信息,对未知总体分布任务是根据样本所提供的信息,对未知总体分布的某些方面的假设作出合理的判断。的某些方面的假设作出合理的判断。假设检验的程序是,先根据实际问题的要求提出假设检验的程序是,先根据实际问题的要求提出一个论断,称为统计假设;然后根据样本的
8、有关一个论断,称为统计假设;然后根据样本的有关信息,对假设的真伪进行判断,作出拒绝或接受信息,对假设的真伪进行判断,作出拒绝或接受假设的决策。假设的决策。假设检验的基本思想是概率性质的反证法。假设检验的基本思想是概率性质的反证法。概率性质的反证法的根据是小概率事件原理,该概率性质的反证法的根据是小概率事件原理,该原理认为原理认为“小概率事件在一次试验中几乎是不可小概率事件在一次试验中几乎是不可能发生的能发生的”。-15-哈工程经济管理学院-16-哈工程经济管理学院 对于对于一元线性回归模型,假设为:一元线性回归模型,假设为:0:0:1110HH 然后根据样本观测值和估计值,计算然后根据样本观测
9、值和估计值,计算F统计量统计量的数值:的数值:1/)1(22knYYkYYknRSSkESSFiii-17-哈工程经济管理学院 F F 统计量服从自由度为统计量服从自由度为(,)k nk1的的F分布。选定分布。选定一个显著性水平一个显著性水平,查,查F分布表分布表(见本书附录),(见本书附录),可以得到一个临界值可以得到一个临界值Fk nk(,)1。1/1/22knRkRF其中,其中,2R为判定系数,为判定系数,k为模型中解释变量的个为模型中解释变量的个数,数,n为样本容量。为样本容量。-18-哈工程经济管理学院 如果所计算的如果所计算的FFk nk(,)1,则在,则在(1(1)的的置信概率下
10、拒绝原假设置信概率下拒绝原假设H0,即模型的线性关系显著,即模型的线性关系显著成立,模型通过方程显著性检验。如果所计算的成立,模型通过方程显著性检验。如果所计算的F Fk nk(,)1,则在,则在(1(1)的置信概率下接受的置信概率下接受原假设原假设H0,即模型的线性关系显著不成立,模型未,即模型的线性关系显著不成立,模型未通过方程显著性检验。通过方程显著性检验。-19-哈工程经济管理学院4 4、方程显著性、方程显著性F F检验的例题检验的例题-20-哈工程经济管理学院-21-哈工程经济管理学院 拟合优度检验和方程显著性检验是从不同拟合优度检验和方程显著性检验是从不同原理出发的两类检验,前者是
11、从已经得到估计原理出发的两类检验,前者是从已经得到估计的模型出发,检验它对样本观测值的拟合程度,的模型出发,检验它对样本观测值的拟合程度,后者是从样本观测值出发检验模型总体线性关后者是从样本观测值出发检验模型总体线性关系的显著性。系的显著性。5 5、关于拟合优度检验与方程显著性检验关于拟合优度检验与方程显著性检验关系的讨论关系的讨论-22-哈工程经济管理学院 可见,与R2同向变化:当R2 时,;当R2=1时,为无穷大;R2越大,值也越大。RnnkkF2111FE S SkR S Snk()1)1/()1/(12nTSSknRSSR因此,检验是所估计回归总显著性的一个度量,也是对的一个显著性检验
12、。即:2R检验原假设,等价于检验0:20RH0:210H-23-哈工程经济管理学院3.3变量显著性检验变量显著性检验(t检验检验)Testing the Individual Significance-24-哈工程经济管理学院变量显著性检验即变量显著性检验即对回归系数的显著性进对回归系数的显著性进行检验,行检验,如果变量是显著的,那么如果变量是显著的,那么回归系回归系数数应该显著地不为应该显著地不为0。于是,在变量显著性。于是,在变量显著性检验中设计的原假设为检验中设计的原假设为:H0:i=0而备择假设为:而备择假设为:H1:i 0 其中其中 的下角标的下角标i,在一元回归模型中取值,在一元回
13、归模型中取值1:在二元回归模型中取值在二元回归模型中取值1、2。-25-哈工程经济管理学院然后根据样本观测值和估计值,计算统计量然后根据样本观测值和估计值,计算统计量:iiiSt)1(kntt该统计量服从自由度为该统计量服从自由度为()nk1的的t分布,即分布,即 在在t统计量的算式中,统计量的算式中,i为总体回归系数,为总体回归系数,i为相应的参数估计量,为相应的参数估计量,iS为参数估计量为参数估计量i的标准差。的标准差。-26-哈工程经济管理学院对于一元回归模型,对于一元回归模型,221ixS,其中,其中2为随机为随机误差项方差的估计量,误差项方差的估计量,21221222nxyknYY
14、iiii对于二元回归模型,对于二元回归模型,2212221221222122212221)()(xxxxxSExxxxxSE-27-哈工程经济管理学院222221212222221iiiiiixxyyyekne计算出计算出t统计量后,要选定一个显著性水平统计量后,要选定一个显著性水平,结合自由度结合自由度()nk1,由,由t分布表分布表(见附表(见附表 5),),查得临界值查得临界值tnk21()。-28-哈工程经济管理学院如果计算出的如果计算出的t统计量的绝对值统计量的绝对值ttnk21(),则在则在(1)的置信概率下拒绝原假设的置信概率下拒绝原假设H0。表。表明在明在(1)的置信概率下,的
15、置信概率下,i不是由不是由0i这样的这样的总体产生的,总体产生的,i显著地不为显著地不为 0,即变量,即变量iX对被对被解释变量的影响是显著的;解释变量的影响是显著的;-29-哈工程经济管理学院如果如果t)1(2knt,则在,则在(1)的置的置信概率下接受原假设信概率下接受原假设 H0,表明在,表明在(1)的置信概率下,的置信概率下,与与 0 没有什麽差别,没有什麽差别,即变量即变量 Xi对被解释变量的影响是不显著对被解释变量的影响是不显著的。的。-30-哈工程经济管理学院对于对于一元线性回归模型,一元线性回归模型,F 检验与检验与 t 检验检验的假设均为:的假设均为:0:0:1110HH此时,此时,两种检验两种检验是一致的。是一致的。在一元线性回归中,在一元线性回归中,t t检验与检验与F F检验是一致的检验是一致的-31-哈工程经济管理学院另一方面,两个统计量之间有如下关系:22212221222122)2()2()2()2(iiiiiiiixnexnenexneyF 2222112txneii但在多元回归情况下,两种检验说明的问题不同、但在多元回归情况下,两种检验说明的问题不同、作用不同,不能相互取代。作用不同,不能相互取代。