1、STAT第六章第六章 相关分析与回归分析相关分析与回归分析第六章第六章 相关分析与回归分析相关分析与回归分析STAT第六章第六章 相关分析与回归分析相关分析与回归分析一、变量间的相互关系一、变量间的相互关系二、相关关系的种类二、相关关系的种类三、相关表和相关图三、相关表和相关图四、相关系数四、相关系数五、相关分析与回归分析五、相关分析与回归分析6.16.1相关分析与回归分析概述相关分析与回归分析概述返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析一、变量间的相互关系一、变量间的相互关系返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析 指变量之间具有的严格的确定性的指
2、变量之间具有的严格的确定性的依存关系。依存关系。函数关系可以用一个数学表达式来表示。函数关系可以用一个数学表达式来表示。2:rS圆面积例STAT第六章第六章 相关分析与回归分析相关分析与回归分析 指客观现象间确实存在,但数量上不指客观现象间确实存在,但数量上不是严格对应的依存关系。是严格对应的依存关系。如:家庭收入与消费支出:如:家庭收入与消费支出:家庭收入增加,则消费支出也家庭收入增加,则消费支出也相应增加。相应增加。STAT第六章第六章 相关分析与回归分析相关分析与回归分析STAT第六章第六章 相关分析与回归分析相关分析与回归分析STAT第六章第六章 相关分析与回归分析相关分析与回归分析
3、例:判断下列关系是什么关系?例:判断下列关系是什么关系?1)物体体积随温度升高而膨胀,随压力加大而)物体体积随温度升高而膨胀,随压力加大而压缩;压缩;2)测量次数愈多,其平均长度愈接近实际值;)测量次数愈多,其平均长度愈接近实际值;3)家庭收入愈多,其消费支出也有增长趋势;)家庭收入愈多,其消费支出也有增长趋势;4)秤砣的误差愈大,权衡的误差愈大;)秤砣的误差愈大,权衡的误差愈大;5)物价愈上涨,商品的需求量愈小;)物价愈上涨,商品的需求量愈小;6)文化程度愈高,人口平均寿命也愈长;)文化程度愈高,人口平均寿命也愈长;7)园的半径愈长,园的周长也愈长;)园的半径愈长,园的周长也愈长;8)农作物
4、产量与雨量、施肥量等有密切关系。)农作物产量与雨量、施肥量等有密切关系。STAT第六章第六章 相关分析与回归分析相关分析与回归分析二、相关关系的种类二、相关关系的种类 返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析一个变量的变量值完全由另一个或另一个变量的变量值完全由另一个或另一组变量值所决定。一组变量值所决定。两个变量的变量值互不影响,其数量两个变量的变量值互不影响,其数量变化各自独立。变化各自独立。两个现象之间的关系介于完全相关和两个现象之间的关系介于完全相关和不相关之间。不相关之间。STAT第六章第六章 相关分析与回归分析相关分析与回归分析当一个变量变动时,另一个变当一个
5、变量变动时,另一个变量也相应发生大致均等的变动。量也相应发生大致均等的变动。当一个变量变动时,另一个变当一个变量变动时,另一个变量也相应发生变动,但这种变动是量也相应发生变动,但这种变动是不均等的。不均等的。STAT第六章第六章 相关分析与回归分析相关分析与回归分析两个变量之间的变化方向一致。两个变量之间的变化方向一致。两个变量变化趋势相反。两个变量变化趋势相反。STAT第六章第六章 相关分析与回归分析相关分析与回归分析两个变量之间的相关关系。两个变量之间的相关关系。三个或三个以上变量之间的相关关系。三个或三个以上变量之间的相关关系。在某一变量与多个变量相关时,当假定其他在某一变量与多个变量相
6、关时,当假定其他变量不变,其中两个变量之间的相关关系。变量不变,其中两个变量之间的相关关系。STAT第六章第六章 相关分析与回归分析相关分析与回归分析三、相关表和相关图三、相关表和相关图将某一变量将某一变量x x按其数值大小顺序排按其数值大小顺序排列,然后再将与其相关的另一个变量列,然后再将与其相关的另一个变量y y对应值平行排列,观察对应值平行排列,观察x x由小到大变化由小到大变化时,时,y y的变化情况的变化情况。STAT第六章第六章 相关分析与回归分析相关分析与回归分析企业编号企业编号月产量(千吨)月产量(千吨)X X生产费用(万元)生产费用(万元)Y Y1 12 23 34 45 5
7、6 67 78 81.21.22.02.03.13.13.83.85.05.06.16.17.27.28.08.0626286868080110110115115132132135135160160八个同类工业企业的月产量与生产费用八个同类工业企业的月产量与生产费用正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy又称又称,用直角坐标系的横轴代表变量,用直角坐标系的横轴代表变量x,纵轴代表变量纵轴代表变量y,将两个变量间相对应的变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。点分布状况的图
8、形。返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析 测定测定之间之间的密切程度和的密切程度和相关方向的统计指标,相关方向的统计指标,用用r表示。表示。简简 单单 相相关关 系系 数数四、相关系数四、相关系数STAT第六章第六章 相关分析与回归分析相关分析与回归分析以两个变量与各自均值的离差为基础,通过两个离差相乘来反映变量之间相关程度。STAT第六章第六章 相关分析与回归分析相关分析与回归分析基本公式基本公式yxyxr),cov(其中,其中,nyyxxyx)(),cov(为为x x和和y y的协方差;的协方差;nxxx2)(为为x x的标准差;的标准差;nyyy2)(为为y y
9、的标准差;的标准差;STAT第六章第六章 相关分析与回归分析相关分析与回归分析1、协方差的意义、协方差的意义 nyyxxyx)(),cov(协方差反映了两个变量协方差反映了两个变量x x和和y y的的共变性共变性。STAT第六章第六章 相关分析与回归分析相关分析与回归分析说明x和y的变动方向相同;说明x和y的变动方向相反;说明x和y的共变性平均来说是均衡的。0),cov(yx0),cov(yx0),cov(yxSTAT第六章第六章 相关分析与回归分析相关分析与回归分析xy0 xynyyxxyx)(),cov(+0yyxx-+-0 xx0yySTAT第六章第六章 相关分析与回归分析相关分析与回归
10、分析则r0,说明x和y之间为正线性相关;则r0 为为正相关正相关,r 0 为为负相关负相关;|r|=0 表示不存在表示不存在关系;关系;|r|1 表示表示完全完全相关相关;|r|1,说明,说明x与与y线性相关度越高;线性相关度越高;|r|0,说明,说明x与与y线性相关度越低。线性相关度越低。STAT第六章第六章 相关分析与回归分析相关分析与回归分析|r|r|0.3 0.3 微弱线性相关;微弱线性相关;0.30.3|r|r|0.5 0.5 低度线性相关;低度线性相关;0.50.5|r|r|0.8 0.8 显著线性相关;显著线性相关;0.80.8|r|r|1.0 1.0 高度高度线性相关。线性相关
11、。STAT第六章第六章 相关分析与回归分析相关分析与回归分析 年份年份江苏省江苏省GDPGDP(亿元)(亿元)X X江苏省海洋产业总产值(亿元)江苏省海洋产业总产值(亿元)Y Y201920197199.957199.95171.24171.24201920197697.827697.82142.46142.46200020008582.738582.73146.04146.04201920199514.69514.6171.98171.982019201910631.7510631.75211.54211.542019201912460.8312460.83453.61453.6120192
12、01915403.1715403.17565.22565.222019201918305.6618305.66739.58739.582019201921645.0821645.08128712872019201925741.1525741.151873.51873.5STAT第六章第六章 相关分析与回归分析相关分析与回归分析STAT第六章第六章 相关分析与回归分析相关分析与回归分析4.11144863347.6383857224706409817.57627.13718222xyyxyx,9688.017.576247.6383857107.13718222470640981017.5762
13、7.1371824.11144863310)()(222222 yynxxnyxxynr解:解:说明江苏省海洋产业总产值和江说明江苏省海洋产业总产值和江苏省地区经济之间存在苏省地区经济之间存在正的高度线性正的高度线性相关关系相关关系。返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析应用EXCEL的结果:回归统计回归统计Multiple RMultiple R0.9687530.968753R SquareR Square0.9384820.938482Adjusted R SquareAdjusted R Square0.9307920.930792标准误差标准误差153.487
14、7153.4877观测值观测值1010STAT第六章第六章 相关分析与回归分析相关分析与回归分析计算计算值:值:给定的显著性水平和自由度(给定的显著性水平和自由度(n n-2-2),查找),查找分布表中相应的临界值分布表中相应的临界值t t/2/2。若若t tt t/2/2,表明,表明在统计上是显著的。在统计上是显著的。若若t tt t/2/2,表明,表明在统计上是不显著在统计上是不显著的。212rnrt0:0:10HHSTAT第六章第六章 相关分析与回归分析相关分析与回归分析 目的:虚假相关目的:虚假相关是指当是指当r r趋近于趋近于1 1时,理论上认为变量之间具有高度时,理论上认为变量之间
15、具有高度的相关关系,但实际上这两个变量的相关关系,但实际上这两个变量之间毫无因果关系。之间毫无因果关系。如:印度的粮食产量与美国的啤酒如:印度的粮食产量与美国的啤酒价格理论上价格理论上r r趋近于趋近于1 1。STAT第六章第六章 相关分析与回归分析相关分析与回归分析【例】假设根据对样本观测数据计算假设根据对样本观测数据计算出某公司的股票价格与气温的样本相关出某公司的股票价格与气温的样本相关系数系数r=0.5,试问是否可以根据的显,试问是否可以根据的显著水平认为该公司的股票与气温之间存著水平认为该公司的股票与气温之间存在一定程度的线性相关关系在一定程度的线性相关关系?STAT第六章第六章 相关
16、分析与回归分析相关分析与回归分析解:解:1547.1122rnrt查表可知:显著水平为,临界值查表可知:显著水平为,临界值t/2 t/2(4)=2.776.(4)=2.776.因为因为t t值小于值小于2.7762.776,所以,所以,不能通过显不能通过显著性检验。著性检验。0:0:10HHSTAT第六章第六章 相关分析与回归分析相关分析与回归分析解:解:05597.11122rnrt查表可知:显著水平为,临界值查表可知:显著水平为,临界值t/2 t/2(8)=2.306.(8)=2.306.因为因为t t值大于值大于2.3062.306,所以,所以,能通过显著能通过显著性检验。性检验。0:0
17、:10HH接上例:接上例:STAT第六章第六章 相关分析与回归分析相关分析与回归分析五、相关分析与回归分析五、相关分析与回归分析 用相关图表和相关系数研究两个或两个以上变用相关图表和相关系数研究两个或两个以上变量之间相关程度的方法。量之间相关程度的方法。对具有相关关系的两个或两个以上变量之间数对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。为估计预测提供一个重要的方法。q理论和方法具有一致性;理论和
18、方法具有一致性;q无相关就无回归,相关程度越高,无相关就无回归,相关程度越高,回归越好;回归越好;q 相关系数和回归系数方向一致,可相关系数和回归系数方向一致,可以互相推算。以互相推算。q相关分析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要确定自变量和因变量;要确定自变量和因变量;q相关分析中相关分析中x、y均为随机变量,回归分均为随机变量,回归分析中只有析中只有y为随机变量;为随机变量;q相关分析测定相关程度和方向,回归分相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。析用回归模型进行预测和控制。返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析返
19、回一一 元元线线性性回回归归Simple Linear regressionSTAT第六章第六章 相关分析与回归分析相关分析与回归分析一、简单线性回归方程的建立一、简单线性回归方程的建立iixy10为模型参数与式中:10)(YEXiixy10截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态为正为正 为负为负 为为0111iixy10回归系数回归系数 的意义:的意义:表明自变量表明自变量x x每变动一每变动一个单位,因变量个单位,因变量y y平均变动平均变动 个单位。个单位。式中:式中:是是y y的估计值,的估计值,为直线在为直线在y y轴上的截轴上的截距,距,为斜率,又称为
20、回归系数。为斜率,又称为回归系数。iy0111STAT第六章第六章 相关分析与回归分析相关分析与回归分析iiiiiieyexyyyxxy)(1010值应为的实际而变量之间的平均变动关系,变量与是理论模型,表明xy10 xy10残差残差(Residual):e普通最小二乘法(普通最小二乘法(OLS)基本数学要求:基本数学要求:min)(02yyyy02012min,min)(1010102102xxyxyxyyy,有求偏导数,并令其为零、分别对函数中,有由21010 xxxyxnyxynxnyxxnyxxyn110221)(STAT第六章第六章 相关分析与回归分析相关分析与回归分析某企业上半年产
21、品产量与单位成本资料如下:某企业上半年产品产量与单位成本资料如下:要求:计算相关系数,说明两个变量相关的密切要求:计算相关系数,说明两个变量相关的密切程度。配合回归方程,指出产量每增加程度。配合回归方程,指出产量每增加10001000件时,件时,单位成本平均变动多少?假定产量为单位成本平均变动多少?假定产量为60006000件时,件时,单位成本为多少元?单位成本为多少元?月份月份 产量(千件)产量(千件)单位成本(元)单位成本(元)1 12 273732 23 372723 34 471714 43 373735 54 469696 65 56868 2222)()(yynxxnyxxyn22
22、6 148121 4260.90916 79216 30268426 iixy82.137.77 82.1)(221 xxnyxxyn37.7710 xy 返回iixy10回归系数回归系数 的经济意义:它表示当的经济意义:它表示当x x每变动一每变动一个单位时,个单位时,y y平均来说变动多少。即:产量平均来说变动多少。即:产量x x每每增加增加10001000件,单位成本平均下降件,单位成本平均下降1.821.82元。元。1STAT第六章第六章 相关分析与回归分析相关分析与回归分析应用应用EXCELEXCEL的结果:的结果:回归统计回归统计Multiple RMultiple R0.9090
23、910.909091R SquareR Square0.8264460.826446Adjusted R Adjusted R SquareSquare0.7830580.783058标准误差标准误差0.9770080.977008观测值观测值6 6CoefficCoefficientsients标准标准误差误差t Statt StatIntercept77.3677.361.51171.5117 51.17851.178XVariable11.8181.8180.41660.4166-4.36444.3644STAT第六章第六章 相关分析与回归分析相关分析与回归分析已知某局下10 个企业销售
24、收入与销售利润的数据资料如下:试求两者的回归直线方程。(单位是万元)STAT第六章第六章 相关分析与回归分析相关分析与回归分析 解:散点图为:STAT第六章第六章 相关分析与回归分析相关分析与回归分析计算表格:STAT第六章第六章 相关分析与回归分析相关分析与回归分析代入公式计算得:425.010190088.01021088.0190432810211903.46210)(102221nxnyxxnyxxynxy088.0425.0则方程为:STAT第六章第六章 相关分析与回归分析相关分析与回归分析应用应用EXCELEXCEL的结果:的结果:回归统计回归统计Multiple RMultipl
25、e R0.9518120.951812R SquareR Square0.9059460.905946Adjusted R Adjusted R SquareSquare0.8941890.894189标准误差标准误差0.2691130.269113观测值观测值1010CoeffiCoefficientscients标准标准误差误差 t t StatStatInterceptIntercept0.4250.4250.2090.209 2.0342.034X VariableX Variable0.0880.0880.0100.010 8.7788.778STAT第六章第六章 相关分析与回归分析
26、相关分析与回归分析二、估计标准误二、估计标准误 估计标准误是衡量因变量的估计标准误是衡量因变量的估计值估计值 与观测值与观测值 之间离差的之间离差的平均水平指标。平均水平指标。它可以说明回归方程的代表性。它可以说明回归方程的代表性。iy iy22)(210222nyxyynyyneSiiiiiiiY其中:其中:估计标准误;:估计标准误;:估计:估计值;值;:实际值;:实际值;n-2n-2:回归估计:回归估计自由度。自由度。YSiy iySTAT第六章第六章 相关分析与回归分析相关分析与回归分析02220y2t1XVarSSnXX()()2221)()(1XXSSVartyjSntj2)2(ii
27、xy10STAT第六章第六章 相关分析与回归分析相关分析与回归分析书上例题的书上例题的EXCEL结果:结果:回归统计回归统计Multiple RMultiple R0.945860.94586R SquareR Square0.894650.89465Adjusted R SquareAdjusted R Square0.882940.88294标准误差标准误差2.351882.35188观测值观测值1111CoefficiCoefficientsents标准误差标准误差t Statt StatLower Lower 95%95%UpperUpper95%95%InterceptInterce
28、pt0.8059220.805922 2.1298442.129844 0.3783950.378395-4.01212-4.01212 5.6239655.623965X Variable 1X Variable 10.3031940.303194 0.0346810.034681 8.7424478.7424470.2247410.224741 0.3816480.381648STAT第六章第六章 相关分析与回归分析相关分析与回归分析 回答以下问题:回答以下问题:1 1、相关系数:、相关系数:2 2、回归方程:、回归方程:3 3、估计标准误差:、估计标准误差:4 4、回归系数的、回归系数的
29、95%95%置信区间:置信区间:94586.0riixy3032.08059.03519.2yS3816.02247.01 189127xy29697002x4290 x11.121892y1.260y 返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析解:9934.01.26011.1218984290296970081.26042901891278)()(222222 yynxxnyxxyn2719.78429007419.081.26007419.04290296970081.26042901891278)(102221 nxnyxxnyxxynxy07419.02719.7
30、STAT第六章第六章 相关分析与回归分析相关分析与回归分析8635.22818912707419.01.2602719.711.1218922)(210222nyxyynyyneSiiiiiiiYSTAT第六章第六章 相关分析与回归分析相关分析与回归分析()()()()ttttttYYYYYYYYe222()()()ttttYYYYYY三、拟合程度的评价三、拟合程度的评价总离差平方和的分解总离差平方和的分解对上式两边取平方、求和、数学处理后,得到:对上式两边取平方、求和、数学处理后,得到:211nnSSESSRSSTSTAT第六章第六章 相关分析与回归分析相关分析与回归分析yy yyyyyy2
31、)(yySST2)(yySSE2)(yySSR误差平方和误差平方和回归回归平方和平方和总离差平方和总离差平方和STAT第六章第六章 相关分析与回归分析相关分析与回归分析 各自的意义:各自的意义:总变差(总变差(SSTSST)剩余变差(剩余变差(SSESSE)回归变差(回归变差(SSRSSR)说明了各观察说明了各观察 表示实际值围表示实际值围 表示估计值与表示估计值与 值与平均值的值与平均值的 绕回归直线的绕回归直线的 平均值的离差平均值的离差 离差平方和。离差平方和。变动程度。它变动程度。它 平方和。说明平方和。说明 是除了是除了x x对对y y的的 了了x x变动引起变动引起 线性影响外其线
32、性影响外其 估计值变动的估计值变动的 它随机因素所它随机因素所 程度。程度。引起引起y y的变动。的变动。222)()()(yyyyyyiiii是可以由回归直线是可以由回归直线作出解释的部分作出解释的部分是回归直线是回归直线不能解释的不能解释的部分。部分。STAT第六章第六章 相关分析与回归分析相关分析与回归分析 决定(可决)系数,即有:决定(可决)系数,即有:决定系数是对回归模型拟合程度的综合决定系数是对回归模型拟合程度的综合度量,决定系数越大,模型拟合程度越度量,决定系数越大,模型拟合程度越高;高;决定系数越小,则模型对样本的拟合程决定系数越小,则模型对样本的拟合程度越差。度越差。21SS
33、RSSErSSTSST STAT第六章第六章 相关分析与回归分析相关分析与回归分析 决定系数决定系数r r2 2具有如下特性:具有如下特性:1 1决定系数决定系数r r2 2具有非负性。具有非负性。2 2决定系数的取值范围为决定系数的取值范围为 r r2 2 。3 3决定系数是样本观测值的函数,它决定系数是样本观测值的函数,它也是一个统计量。也是一个统计量。决定系数与相关系数的区别与联系:决定系数与相关系数的区别与联系:区别区别:适用范围不同。:适用范围不同。联系联系:在一元线性回归中,相关系数是:在一元线性回归中,相关系数是可决系数的平方根。可决系数的平方根。STAT第六章第六章 相关分析与
34、回归分析相关分析与回归分析上例:dfdfSSSS回归分析(回归分析(R R)1 128751292875129残差(残差(E E)8 8188467.7188467.7总计(总计(T T)9 930635973063597已知,n=10,r=1。9385.0306359728751292SSTSSRr在江苏省海洋产业总产值的变动中,有在江苏省海洋产业总产值的变动中,有93.85%93.85%是由江苏省的是由江苏省的GDPGDP所决定的。所决定的。STAT第六章第六章 相关分析与回归分析相关分析与回归分析四、显著性检验四、显著性检验1 1、回归模型检验的种类、回归模型检验的种类 1)1)、理论意
35、义检验、理论意义检验 2)2)、一级检验又称统计学检验:利用统计学、一级检验又称统计学检验:利用统计学中的抽样理论来检验样本回归方程的可靠性,中的抽样理论来检验样本回归方程的可靠性,又可分为拟合程度评价和显著性检验。又可分为拟合程度评价和显著性检验。3)3)、二级检验又称计量经济学检验、二级检验又称计量经济学检验STAT第六章第六章 相关分析与回归分析相关分析与回归分析 2 2、T T检验检验 1)1)提出假设:提出假设:001110:HH2)2)确定显著水平:确定显著水平:5%,一般取3)3)确定检验统计量并计算其值:确定检验统计量并计算其值:2)-T(n)(11服从st 4)4)查查T T
36、分布表,得:分布表,得:)2(2nt5)5)判断判断STAT第六章第六章 相关分析与回归分析相关分析与回归分析CoefficientsCoefficients标准误差标准误差t Statt StatInterceptIntercept0.8059220.8059222.1298442.129844 0.3783950.378395X Variable 1X Variable 10.3031940.3031940.0346810.034681 8.7424478.742447书上例题的书上例题的EXCELEXCEL结果:结果:2)2)确定显著水平:确定显著水平:5%取3)3)计算检验统计量的值:
37、计算检验统计量的值:7424.8034681.0303194.0)(11st1)1)提出假设:提出假设:001110:HHSTAT第六章第六章 相关分析与回归分析相关分析与回归分析4)4)查查T T分布表,得:分布表,得:262.2)9(025.0t5)5)结论:结论:个显著因素。入的一广告费是影响年销售收即:接受H所以,拒绝H2.262,(9)t8.7424因为t100.025STAT第六章第六章 相关分析与回归分析相关分析与回归分析 3 3、F F检验检验 1)1)提出假设:提出假设:001110:HH2)2)确定显著水平:确定显著水平:5%,一般取3)3)确定检验统计量并计算其值:确定检
38、验统计量并计算其值:2)-nF(1,21服从nSSESSRF4)4)查查F F分布表,得:分布表,得:)2,1(nF5)5)判断判断STAT第六章第六章 相关分析与回归分析相关分析与回归分析001110:HH书上例题的书上例题的EXCELEXCEL结果:结果:2)2)确定显著水平:确定显著水平:5%取3)3)计算检验统计量的值:计算检验统计量的值:4304.76978216.4917633.42221nSSESSRMSEMSRF1)1)提出假设:提出假设:dfdfSSSSMSMSF F回归分析回归分析1 1422.7633422.7633 422.7633422.7633 76.4303876
39、.43038残差残差9 949.7821649.78216 5.5313515.531351总计总计1010472.5455472.5455 STAT第六章第六章 相关分析与回归分析相关分析与回归分析4)4)查查F F分布表,得:分布表,得:12.5)9,1(05.0F5)5)结论:结论:显著的。线性关系是费与年销售收入之间的的,即广告建立的回归模型是显著即:接受所以,拒绝因为1005.0HH,12.5)9,1(4304.76FFSTAT第六章第六章 相关分析与回归分析相关分析与回归分析五、简单线性回归模型预测五、简单线性回归模型预测对于给定的对于给定的 X X 值,求出值,求出 Y Y 预测
40、值。预测值。FFxy10对于给定的对于给定的 X X 值,求出值,求出 Y Y 的的置信区间置信区间。(1 1)计算点预测值)计算点预测值 ;(2 2)计算估计标准误)计算估计标准误 ;(3 3)给定显著性水平)给定显著性水平 ,查标准正,查标准正态分布表,得临界值态分布表,得临界值 ;(4 4)下限)下限=上限上限=fy YS)2(2ntYfSnty)2(2YfSnty)2(2STAT第六章第六章 相关分析与回归分析相关分析与回归分析实际情况,一般会有一个修正系数:实际情况,一般会有一个修正系数:22)()(11XXXXnSSfyefSTAT第六章第六章 相关分析与回归分析相关分析与回归分析
41、返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析解:6611.4470007419.02719.707419.02719.7FFxy(十万元)万元)700(7000Fx447.2)6(95.45%12t查表得:66837.654,51.即8635.2447.26611.44)2(2YFSntySTAT第六章第六章 相关分析与回归分析相关分析与回归分析四、二元线性回归方程四、二元线性回归方程 ,称为偏回归系数。称为偏回归系数。:当取固定值时,每变动一个单位所:当取固定值时,每变动一个单位所引起引起y y的平均变动量。的平均变动量。:当取固定值时,每变动一个单位所:当取固定值时,每变
42、动一个单位所引起引起y y的平均变动量。的平均变动量。基本模型:基本模型:22110 xxy1212返回STAT第六章第六章 相关分析与回归分析相关分析与回归分析xy假设某地区住宅建筑面积与建造成假设某地区住宅建筑面积与建造成本的有关资料如下:本的有关资料如下:建筑地编号建筑面积(万平方米)建造成本(万元)1414.82212.83313.34515.45414.36515.9STAT第六章第六章 相关分析与回归分析相关分析与回归分析用EXCEL计算结果如下 Multiple RMultiple R0.972616540.97261654R SquareR Square0.9459829330
43、.945982933Adjusted R SquareAdjusted R Square0.9324786660.932478666标准误差标准误差0.3115656760.311565676观测值观测值6 6STAT第六章第六章 相关分析与回归分析相关分析与回归分析CoefficiCoefficientsents标准误标准误差差Lower Lower 95%95%Upper Upper 95%95%InterceptIntercept10.5926810.59268 0.474260.47426 9.27599.2759 11.90911.909XVariable 1XVariable 10
44、.9975610.997561 0.119180.11918 0.66660.6666 1.32841.3284STAT第六章第六章 相关分析与回归分析相关分析与回归分析根据上表资料:根据上表资料:1 1)、建立建筑面积与建造成本的相关系数,并)、建立建筑面积与建造成本的相关系数,并说明二者的相关关系。说明二者的相关关系。2 2)、建立建筑面积与建造成本的回归方程。)、建立建筑面积与建造成本的回归方程。3 3)、解释回归系数的经济意义。)、解释回归系数的经济意义。4 4)、估计标准误差为多少?)、估计标准误差为多少?5 5)、对回归系数进行)、对回归系数进行T T检验。已知。检验。已知。6 6
45、)、写出回归系数)、写出回归系数95%95%的置信区间。的置信区间。7 7)、估计当建筑面积为)、估计当建筑面积为4.54.5万平方米时,建造成万平方米时,建造成本本95%95%置信区间为多少?置信区间为多少?8 8)、最小二乘法的数学依据是什么?)、最小二乘法的数学依据是什么?776.2)4(025.0tSTAT第六章第六章 相关分析与回归分析相关分析与回归分析解:1)、相关系数为:9726.0r意义:建筑面积和建造成本之间存在正高度线性相关关系。xy9976.05926.102)、直线方程为:3)、当建筑面积每增加1万平方米时,建造成本平均上升0.9976万元。STAT第六章第六章 相关分
46、析与回归分析相关分析与回归分析4)、估计标准误:1631.0YS 002120HH3696.8t776.2)4(025.0t025.0tt 5)、T检验 所以拒绝原假设接受备择假设即二者之间线性关系确实成立。STAT第六章第六章 相关分析与回归分析相关分析与回归分析3285.16666.02776.2)4(%,951025.0t5.4Fx0818.155.49976.05926.109976.05926.10Fxy865.00818.153116.0776.2082.15)4(025.0FYSty6)、回归系数的95%区间为7)、预测即(14.22,15.95)8)、OLS的依据是残差平方和最小,即:min)2yy(