1、2023-5-61第八章 相关与回归分析第一节 相关与回归分析的基本概念 第三节 一元线性回归分析 第四节 多元线性回归分析【学习目标】通过对本章的学习,重点掌握回归分析的估计和检验方法;掌握相关分析的种类及三种相关系数的计算方法;在此基础上能够运用相关分析和回归分析的基本方法解释实际社会经济问题。重点与难点:相关系数的计算及其检验;多元线性回归分析。第五节 非线性回归分析 第二节 相关分析 第1页/共92页2023-5-62第一节 相关与回归分析的基本概念 (一)函数关系 一、相关关系与函数关系 第八章 相关与回归分析 函数关系是指现象之间存在着严格的依存关系,亦即当其它条件不变时,对于某一
2、自变量或几个自变量的每一数值,都有因变量的一个的确定值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。第2页/共92页2023-5-63第一节 相关与回归分析的基本概念 (二)统计关系 一、相关关系与函数关系 第八章 相关与回归分析统计关系不同于函数关系,当重复观测时,观测点不是完全落在统计关系曲线上,而是围绕统计关系曲线散布。统计关系可以表示为确定部分和随机性部分二者之和,这是回归分析的基础。相关关系因果关系第3页/共92页2023-5-64案例分析相关关系与因果关系一家研究机构有一项惊人的发现:统计数据显示,脚长的儿童拼写能力比脚短的儿童强。原来他们调查的是一群年龄不同的儿童,
3、脚长的儿童比脚短的儿童年龄大!赶快回去量一下儿子的脚长我要把脚拉长一点!第4页/共92页2023-5-65按涉及变量的多少分为按照表现形式不同分为按照变化方向不同分为直线相关曲线相关负相关正相关复相关单相关偏相关第八章 相关与回归分析第5页/共92页2023-5-664.按相关的程度分为5.按变量之间因果 关系的方向分为完全相关不完全相关不相关双向因果相关单向因果相关虚假相关第八章 相关与回归分析第6页/共92页2023-5-67第一节 相关与回归分析的基本概念 第八章 相关与回归分析三、相关分析与回归分析 回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的依赖关系。相关分析是
4、测度两个变量之间的线性关联度的,并用一些指数(相关系数)表示相关程度。第7页/共92页2023-5-68第一节 相关与回归分析的基本概念 第八章 相关与回归分析三、相关分析与回归分析 q相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;q相关分析中x、y均为随机变量,回归分析中只有y为随机变量;q相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。区别:第8页/共92页2023-5-69第一节 相关与回归分析的基本概念 第八章 相关与回归分析三、相关分析与回归分析联系:q 相关分析是回归分析的基础和前提。q 回归分析是相关分析的深入和继续。第9页/共92页2023-5-61
5、0第一节 相关与回归分析的基本概念 第八章 相关与回归分析四、相关表与相关图 (一)简单相关表 将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便得到简单的相关表。第10页/共92页2023-5-611第一节 相关与回归分析的基本概念 第八章 相关与回归分析 企业编号企业编号月产量(千吨)月产量(千吨)X生产费用生产费用(万元万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用第11页/共92页2023-5-612第一节 相关与回归分析的基本概念 第八章 相关与回归分析四、
6、相关表与相关图 (二)分组相关表 单变量分组表 双变量分组表 三变量分组表。第12页/共92页2023-5-613第一节 相关与回归分析的基本概念 第八章 相关与回归分析 1.单变量分组表 表 某纺织厂工人看管织机台数和时劳动生产率相关表 第13页/共92页2023-5-614第一节 相关与回归分析的基本概念 第八章 相关与回归分析 2.双变量分组表 表居住时间与对百货商场的熟悉程度的双变量分组表第14页/共92页2023-5-615第一节 相关与回归分析的基本概念 第八章 相关与回归分析 3.三变量分组表 假定对于某项私家车购买意向的调查,最初以教育水平和私家车拥有情况进行分析,对1000人
7、调查的结果用二维列联表表示如:第15页/共92页2023-5-616第一节 相关与回归分析的基本概念 第八章 相关与回归分析 3.三变量分组表 表教育程度和私家车拥有状况的双变量分析第16页/共92页2023-5-617第八章 相关与回归分析 从上表中可以看出,文化程度越高的人拥有私家车的比例越高,这和实际情况不太相符,于是我们引入收入变量,作三变量的交叉列表分析:教育程度、收入与私家车拥有状况的三变量分析 私家车拥有状私家车拥有状况况收入水平收入水平低收入低收入高收入高收入教育程度教育程度教育程度教育程度本科及以上本科及以上本科以下本科以下本科及以上本科及以上本科以下本科以下有有没有没有20
8、%(20)80%(80)20%(140)80%(560)40%(60)60%(90)40%(20)60%(30)列合计列合计100%100%100%100%被调查者人数被调查者人数10070015050第17页/共92页2023-5-618正 相 关负 相 关曲线相关不 相 关xyxyxyxy第八章 相关与回归分析(三)相关图第18页/共92页2023-5-619第八章 相关与回归分析 第二节 相关分析 一、简单相关系数及其检验(一)简单相关系数的定义 简单相关系数简称相关系数,是测量两个变量之间线性相关的方向和程度的指标。总体相关系数的表达式为:YDXDYXCov,式中:YXCov,为变量X
9、与变量Y的协方差 XD YD 为变量Y的方差为变量X的方差第19页/共92页2023-5-620第八章 相关与回归分析 第五节 相关分析 一、简单相关系数及其检验 (一)简单相关系数的定义 r 样本相关系数是总体相关系数的估计值。22yyxxyyxxr 简单相关系数通常采用下面的计算公式:2222)()(yynxxnyxxynr第20页/共92页2023-5-621相关系数r的取值范围:r0 为正相关,r 0 为负相关;|r|=0 表示不存在关系;|r|1 表示完全相关;|r|0.4 为低度线性相关;0.4|r|0.7为显著性线性相关;0.7|r|1.0为高度显著性线性相关。第八章 相关与回归
10、分析第21页/共92页2023-5-622第八章 相关与回归分析 第五节 相关分析 一、简单相关系数及其检验 (二)简单相关系数的检验样本相关系数的检验有两种方法:直接检验法,检验法。t第22页/共92页2023-5-623提出假设:0:0:10HH目的检验两变量间线性相关性是否显著步骤构造检验统计量:)2(122ntrnrt第八章 相关与回归分析第23页/共92页2023-5-624 根据给定的显著性水平,确定临界值 ;2t 计算检验统计量并做出决策。22ntt 确定原假设的拒绝规则:22ntt步骤第八章 相关与回归分析第24页/共92页2023-5-625第八章 相关与回归分析 20.02
11、5200.97 8210.9710.2910.29262.447tttntH有:拒绝,表示总体的两变量间线性相关性显著。00:H0:0:,05.0,97.0,810HHrn提出假设:则解:已知当 成立时,则统计量)2(122ntrnrt第25页/共92页2023-5-626第八章 相关与回归分析 第五节 相关分析 二、复相关系数 复相关系数是测量一个变量与其它多个变量之间线性相关程度的指标。为了测定一个变量y与其它多个变量 之间的相关系数,可以考虑构造一个关于的线性组合,通过计算该线性组合与之间的简单相关系数作为变量与之间的复相关系数。具体计算过程如下:kxxx,21kxxx,21第一步,用
12、y 对作回归,得kkxxy110第26页/共92页2023-5-627第八章 相关与回归分析 第五节 相关分析 ;y 第二步,计算 y 和的简单相关系数,此简单相关系数即为y与 之间的复相关系数。kxxx,2122yyyyyyyyR222yyyyR复相关系数的计算公式为:第27页/共92页2023-5-628第八章 相关与回归分析 第五节 相关分析 二、复相关系数 ;复相关系数与简单相关系数的区别是简单相关系数的取值范围是-1,1,而复相关系数的取值范围是0,1。这是因为,在两个变量的情况下,回归系数有正负之分,所以在研究相关时,也有正相关和负相关之分;但在多个变量时,偏回归系数有两个或两个以
13、上,其符号有正有负,不能按正负来区别,所以复相关系数也就只取正值。第28页/共92页2023-5-629第八章 相关与回归分析 当两个变量同时受其它变量影响时,有必要研究当控制其它变量不变时,该两个变量之间的相关关系。这种相关关系被称为偏相关关系。第五节 相关分析 三、偏相关系数 ;计算偏相关系数的原因在于任何两个变量这间的相关关系都可能受其余变量的影响。要考察两个变量之间的纯相关关系,必须排除其余变量的影响,或者说必须使其余变量保持不变。第29页/共92页2023-5-630第八章 相关与回归分析 第五节 相关分析 三、偏相关系数 偏相关系数的计算是以回归分析为基础的。以三个变量的情形为例,
14、此种情况下,的偏相关系数有三个,分别记作 3.12r2.13r 1.23r1x3.12r3x2x为与之间的相关系数;保持不变时,、和 之间的相关系数;1x2.13r2x与为保持不变时,之间的相关系数;3x为1.23r2x3x1x与 保持不变时,之间的相关系数;第30页/共92页2023-5-631第八章 相关与回归分析 第五节 相关分析 uxx3101计算残差3101xxuu 3x1x此时中不再含有对的影响。2x3x第二步,求对的回归估计式vxx3102计算残差3102xxvv 3x2x此时中不再含有对的影响。第一步,求对的回归估计式1x3x第31页/共92页2023-5-632第八章 相关与
15、回归分析 第五节 相关分析 u v 第三步,计算和的简单相关系数u 3xu v 3x1x2x由于和中都不再包含的影响,因此和的简单相关系数就是保持不变时,与之间的相关系数。v 223.12 vuvur所以偏相关系数第32页/共92页2023-5-633第八章 相关与回归分析 第五节 相关分析 三、偏相关系数 可以证明,231312222211 rrrxxxxvu21321121rxxu22322221rxxv2232132313123.1211rrrrrr第33页/共92页2023-5-634第八章 相关与回归分析 第五节 相关分析 三、偏相关系数 类似的 2232122312132.1311
16、rrrrrr2212132113231.2311rrrrrr 当变量个数多于3个时,求偏相关系数的原则不变,即应先排除其余变量对所考察两个变量的影响,然后求这两个变量之间的简单相关系数。只是变量越多,数学处理以及偏相关系数的表达式就越复杂。第34页/共92页2023-5-635第二节 一元线性回归分析第八章 相关与回归分析一、一元线性回归分析随机误差项的基本假定 在回归分析中,最简单最基本的单方程模型为一元线性回归模型。一元线性回归分析的总体回归模型为:iiiuxy10 为常数项或截距项,为斜率系数,是随机误差项,又称随机干扰项。第35页/共92页2023-5-636第二节 一元线性回归分析第
17、八章 相关与回归分析一、一元线性回归分析随机误差项的基本假定 第二,模型的设定误差。在线性回归模型中加入随机误差项是基于以下原因:第一,模型不可能包含所有的解释变量。第三,测量误差的影响。第四,其他随机因素的影响。第36页/共92页2023-5-637第二节 一元线性回归分析第八章 相关与回归分析一、一元线性回归分析随机误差项的基本假定 线性回归模型由两部分构成,确定性部分和随机性部分,为确定性部分,称为对于给定值的期望值,可以写为:上式被称为总体线性回归方程。第37页/共92页2023-5-638第二节 一元线性回归分析第八章 相关与回归分析一、一元线性回归分析随机误差项的基本假定 满足以下
18、假定的线性回归模型称为古典(或经典)线性回归模型 假定1:回归模型是正确设定的假定2:解释变量是非随机的假定3:随机误差项的均值为零假定4:随机误差项的方差为一个不变的常数(等方差假定)假定5:随机误差项的观测值互不相关(非序列相关假定)假定6:解释变量与随机误差项不相关假定7:随机误差项服从正态分布假定8:没有一个解释变量是其他任何解释变量的完全线性组合(无多重共线性假定,只适用于多元线性回归模型)第38页/共92页2023-5-639第二节 一元线性回归分析第八章 相关与回归分析二、一元线性回归模型的估计 最小二乘法的意义在于使为了得到这些估计值而最为广泛使用的方法就是普通最小二乘法 xy
19、10 为样本回归方程。2102iiiixyyyQ达到最小来确定01、一般用 01、分别表 分别表示参数的估计iiiyye称为回归残差第39页/共92页2023-5-640bxaybxay残差(Residual):eyy第40页/共92页2023-5-641第二节 一元线性回归分析第八章 相关与回归分析二、一元线性回归模型的估计 0)(2100iixyQ0)(2101iiixxyQ 根据微积分的极值定理,对 求相应于 、的偏导数,并令其等于0,即可求得:Q01 xynxnyxxnyxxyn110221)(第41页/共92页2023-5-642 r0 r0 r=0b0 b0 b=0 xyyxSSr
20、bSSbr;第八章 相关与回归分析第42页/共92页2023-5-643第二节 一元线性回归分析第八章 相关与回归分析二、一元线性回归模型的估计 样本回归直线具有下述性质:第一、它通过 y 和 x 的样本平均数 和 确定的那一点;第二、的平均值和 的平均值相等;第三、残差的平均值是零;第四、残差和 不相关;第五、残差与x不相关。yxiy iyiy 第43页/共92页2023-5-6449520.0,9757.02rr,55086,37887,625,916,162xxyyxn由计算表知xy10第八章 相关与回归分析第44页/共92页2023-5-645序号序号能源消耗量能源消耗量(十万吨)(十
21、万吨)x工业总产值工业总产值(亿元)(亿元)yx2y2xy1234567891011121314151635384042495254596264656869717276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408
22、合计合计91662555086 2617537887第45页/共92页2023-5-646第八章 相关与回归分析5142.6169167961.0166257961.091655086166259163788716102221 xyxxnyxxynxy7961.05142.6第46页/共92页2023-5-647第二节 一元线性回归分析第八章 相关与回归分析二、一元线性回归模型的估计 在回归分析中,不要试着对常数项进行解释,原因有两点:首先,随机误差项部分地是由于忽略了许多边缘自变量而生成的,这些变量的平均效应被置于常数项中。其次,常数项是当所有自变量与误差项为0时,因变量的值,但是自变量与随
23、机误差项的值几乎从不等于0,因为用作经济分析的变量通常是正的。第47页/共92页2023-5-648第二节 一元线性回归分析第八章 相关与回归分析二、一元线性回归模型的估计 2.大样本性质 无偏性(二)一元线性回归模型最小二乘估计量的性质1.小样本性质线性 有效性 渐近无偏性 一致性 第48页/共92页2023-5-649第二节 一元线性回归分析第八章 相关与回归分析三、一元线性回归模型的拟合程度分析 (一)一元线性回归模型的判定系数iiiiyyyyyy第49页/共92页2023-5-650第八章 相关与回归分析yy yyyyyy2)(TyySS2)(RyySS2)(EyySS剩余离差平方和回
24、归离差平方和总离差平方和第50页/共92页2023-5-651第二节 一元线性回归分析第八章 相关与回归分析三、一元线性回归模型的拟合程度分析 可以证明,对上式两边分别平方加总后等式仍然成立,即:(一)一元线性回归模型的判定系数222)()()(iiiyyyyyy 可简写为:TSSESSRSS第51页/共92页2023-5-652第二节 一元线性回归分析第八章 相关与回归分析三、一元线性回归模型的拟合程度分析 判定系数测度了回归直线对观测数据的拟合程度,记为 (一)一元线性回归模型的判定系数2R 22222)()(1)()(yyyyyyyyR第52页/共92页2023-5-6532222)()
25、(yynxxnyxxynr判定系数与相关系数的关系2)(rbr的符号)()()(222222yynxxnyxxynr第八章 相关与回归分析第53页/共92页2023-5-654q判定系数无方向性,相关系数则有方向,其方向与样本回归系数 b 相同;q判定系数说明变量值的总离差平方和中可以用回归线来解释的比例,相关系数只说明两变量间关联程度及方向;第八章 相关与回归分析第54页/共92页2023-5-655第二节 一元线性回归分析第八章 相关与回归分析三、一元线性回归模型的拟合程度分析 估计标准误差是指实际值与估计值的平均离差。其定义公式如下:(二)一元线性回归模型的估计标准误22)(22nxyb
26、yaynyySe第55页/共92页2023-5-656第二节 一元线性回归分析第八章 相关与回归分析四、一元线性回归模型的显著性检验 根据正态分布下最小二乘估计量的性质,可求出的抽样分布为:(一)回归系数的显著性检验22200,xxnxNii2211,xxNi 回归系数的显著性检验就是要检验自变量对因变量的影响程度是否显著的问题。若总体回归系数 ,则总体回归线就是一条水平线,说明两个变量之间没有线性关系,即自变量的变化对因变量没有影响。01第56页/共92页2023-5-657第二节 一元线性回归分析第八章 相关与回归分析四、一元线性回归模型的显著性检验 (1)建立原假设假设样本从一个没有线性
27、关系的总体中选出,即 (一)回归系数的显著性检验0:10H0:11H(2)计算检验统计量t值11st 其中,2i2)(/xxs2nt2-ne2i第57页/共92页2023-5-658第二节 一元线性回归分析第八章 相关与回归分析四、一元线性回归模型的显著性检验 (4)得出检验结果 (一)回归系数的显著性检验 (3)确定显著性水平(一般取0.05),并根据自由度 查 分布表,找出相应的临界值2nt2/at,表明自变量x对因变量y的影响是显著的。,拒绝若2tt 0H,表明自变量x对因变量y的影响是显著的。,拒绝若2tt 0H第58页/共92页2023-5-659第二节 一元线性回归分析第八章 相关
28、与回归分析四、一元线性回归模型的显著性检验 (二)回归方程总体显著性的F检验 F检验的基本步骤为:(1)建立原假设备择假设0:210kH由于备择假设和原假设是对立的,所以备择假设为:至少有一个i不为0。(2)计算F 统计量)1/()(/)()1/(R/E22knyykyyknSSkSSF 第59页/共92页2023-5-660第二节 一元线性回归分析第八章 相关与回归分析四、一元线性回归模型的显著性检验 在原假设成立的条件下,F 统计量服从第一个自由度为 ,第二个自由度为 的 F 分布。k1kn在一元回归下,F 统计量简化为:)2/()(1/)()2/(R1/E22nyyyynSSSSF第60
29、页/共92页2023-5-661第二节 一元线性回归分析第八章 相关与回归分析四、一元线性回归模型的显著性检验 (3)确定显著性水平a(一般取a=0.05),并根据两个自由度查F 分布表,得到相应的临界值 。,则接受原假设,说明回归方程在整体上不显著。F(4)得出检验结果若FF,则拒绝0H,说明回归方程在整体上是显著的;若FF 第61页/共92页2023-5-662第八章 相关与回归分析 多元线性回归模型的一般表示式为:与多元线性回归模型相对应的总体回归方程为:样本回归模型为:第三节 多元线性回归分析一、多元线性回归模型(一)多元线性回归模型的矩阵表示ikikiiiuXXXY22110 kik
30、iiiXXXYE22110ikikiiieXXXY22110样本回归方程为:kikiiiXXXY22110第62页/共92页2023-5-663第八章 相关与回归分析 第三节 多元线性回归分析假设为了得到未知参数的估计值,我们对被解释变量和解释变量进行了n次观测,代入多元线性回归模型,可得n个随机模型:nknknnNkkkkuXXXYuXXXYuXXXY2211022222121021121211101一、多元线性回归模型(一)多元线性回归模型的矩阵表示第63页/共92页2023-5-664第八章 相关与回归分析 为了使多元线性回归分析和计算更方便、更简洁,可以用矩阵形式表示:第三节 多元线性
31、回归分析nkknnnkknuuuXXXXXXXXXYYY211021222121211121111一、多元线性回归模型(一)多元线性回归模型的矩阵表示第64页/共92页2023-5-665第八章 相关与回归分析 第三节 多元线性回归分析定义nYYY21YknnnkkXXXXXXXXX212221212111111Xk10nuuu21u依照矩阵运算法则,上式可表示为:uXY类似的,定义eXYXY第65页/共92页2023-5-666第八章 相关与回归分析 我们把基本假定用矩阵的形式表示出来:第三节 多元线性回归分析一、多元线性回归模型(二)多元线性回归模型的基本假定1.零均值假定可以表示为:0u
32、EnuEuEuE21第66页/共92页2023-5-667第八章 相关与回归分析 第三节 多元线性回归分析2.同方差和无序列相关可以表示为:nnnnnuuuuuuuuuuuuuuuvar,cov,cov,covvar,cov,cov,covvarcov2122121211u 2212221212121,covnnnnnuEuuEuuEuuEuEuuEuuEuuEuEu222000000第67页/共92页2023-5-668第八章 相关与回归分析4.解释变量与随机误差项不相关假定可表示为:或 第三节 多元线性回归分析 3.随机误差项服从正态分布可以表示为:I0u2,N0uXE011ikiiiii
33、kiiiEuXEuXEuuXuXuE 解释变量之间不存在多重共线性可表示为:1 krank XX1krankXX0XX 如果上成立,至少有k+1阶子式不为零,表明解释变量之间也就是要求系数行列式 1 krank X不存在线性相关关系。等价于第68页/共92页2023-5-669第八章 相关与回归分析 由样本回归模型 和样本回归方程 ,可得残差向量为:第三节 多元线性回归分析 二、多元线性回归模型的估计 (一)参数的普通最小二乘估计 eXYXYYYeXYXYee2ieXXXYYXYYXXYX2YY 对上式两边分别对求一阶导数,并令一阶偏导数为零,得 0XX2YX2ee 由假定0XX,可以得到参数
34、估计量为:YXXX1第69页/共92页2023-5-670第八章 相关与回归分析 第三节 多元线性回归分析 二、多元线性回归模型的估计 (一)参数的普通最小二乘估计 对上式两边分别对求一阶导数,并令一阶偏导数为零,得 0XX2YX2ee 由假定0XX,可以得到参数估计量为:YXXX1第70页/共92页2023-5-671第八章 相关与回归分析 第三节 多元线性回归分析二、多元线性回归模型的估计(二)参数普通最小二乘估计量的性质和分布在多元线性回归条件下,参数的最小二乘估计仍然具有线性、无偏性和最小方差性。由于 YXXX1,可以看出具有线性特性,稍加变换,它还是u的线性组合。uXXX1EE uE
35、XXX1由此可见是无偏的。第71页/共92页2023-5-672第八章 相关与回归分析 在无偏性的基础上,我们可以得到 的方差-协方差矩阵:第三节 多元线性回归分析二、多元线性回归模型的估计(二)参数普通最小二乘估计量的性质和分布 varE11XXXuuXXXE 11XXXuuEXXX121XXXIXXX12XX第72页/共92页2023-5-673第八章 相关与回归分析 第三节 多元线性回归分析二、多元线性回归模型的估计(二)参数普通最小二乘估计量的性质和分布uu由于的线性组合,而假定是服从正态分布的,所以也是服从正态分布的,即12,XXNu2由于是不可观测的,所以其方差没有办法计算出来,1
36、2knee 因此的方差-协方差矩阵的估计值为:12XXrva是只能进行估计。可以证明:第73页/共92页2023-5-674第八章 相关与回归分析 在多元线性回归模型中,总平方和仍可分解为回归平方和和残差平方和.第三节 多元线性回归分析 三、多元线性回归模型的检验(一)拟合优度检验 三个平方和的矩阵表示分别为:212YnYYTSSniiYY212YnYYESSniiYYniieRSS12YXYYee第74页/共92页2023-5-675第八章 相关与回归分析 多元线性回归判定系数仍表示为回归平方和与总平方和之比,即 第三节 多元线性回归分析 三、多元线性回归模型的检验(一)拟合优度检验 TSS
37、RSSTSSESSR12调整的判定系数 定义为:2R1/1/12nTSSknRSSR第75页/共92页2023-5-676第八章 相关与回归分析 在一元线性回归中,总体回归方程的显著性检验和斜率参数的显著性检验是等价的,这可以从两类检验的原假设上得到说明。但在多元线性回归中,由于存在多个解释变量,参数的显著性检验不再等价于总体回归方程的显著性检验。第三节 多元线性回归分析 三、多元线性回归模型的检验(二)总体回归方程的显著性检验第76页/共92页2023-5-677第八章 相关与回归分析 第一步,计算检验统计量 第三节 多元线性回归分析 三、多元线性回归模型的检验(三)参数的显著性检验 0:0
38、iH0:1iH具体作法是:iiiicN2,将i进行标准化,标准化后的变量服从标准正态分布:1,0Ncziiiii第77页/共92页2023-5-678第八章 相关与回归分析 ,则拒绝原假设,认为解释变量 若 第三节 多元线性回归分析 三、多元线性回归模型的检验(三)参数的显著性检验第二步,确定显著性水平,查表确定临界值 12 knt12kntti对应变量的影响是显著的。在原假设成立的情况下,该统计量服从个自由度的分布。1kn2由于未知,可用其估计量代替,由此可得到统计量:iiiiict2第78页/共92页2023-5-679第八章 相关与回归分析 第四节 非线性回归分析 一、非线性回归模型的定
39、义 非线性回归分析模型的本质,取决于可否通过某种数量变换或数学变换化成线性回归模型,并从而可进行OLS估计。非线性回归模型可以表示为:tttufY,XftX其中是期望函数,是第t个自变量向量 第79页/共92页2023-5-680第八章 相关与回归分析 4.S型曲线模型 第四节 非线性回归分析 二、可线性化的非线性回归模型的估计 1.双曲线模型iiuxy101 2.二次多项式模型iiiiuxxy22103.半对数和双对数模型iiiuxyln10iiiuxylnln10ixiueyi1015.其它非线性模型iiuxiexey10第80页/共92页2023-5-681第八章 相关与回归分析 对于不
40、可线性化的非线性回归模型,可采用非线性最小二乘法或非线性极大似然法进行估计。第四节 非线性回归分析 三、不可线性化的非线性回归模型的估计 iuxieey10如果只包含一个未知参数,则可写成下面的形式 对于ufyii,X相对应的残差平方和为 niitXfyS12,使上式达到最小的即为非线性最小二乘估计量,第81页/共92页2023-5-682第八章 相关与回归分析 第四节 非线性回归分析 三、不可线性化的非线性回归模型的估计 应该满足以下条件:0,21dXdfXfyddSiniii0,1dXdfXfyiniii即根据极值理论,第82页/共92页2023-5-683第八章 相关与回归分析 高斯-牛
41、顿法的计算步骤如下:第四节 非线性回归分析 取一阶近似值,iXf0第一步:将在某个初值处进行泰勒级数展开,00,0dXdfXfXfiii第二步:令,dXdfzii0,0dXdfzii将第二步代入第一步得000,iiizXfXf 21000,niiiizXfyS 2100niiizy第83页/共92页2023-5-684第八章 相关与回归分析 第四节 非线性回归分析 三、不可线性化的非线性回归模型的估计 000,iiiizXfyyiiiuzy001 第三步:对上面模型进行最小二乘估计,得到的第一步估计值(第一次迭代值)10第四步:用 代替第一步中的直到收收敛为止。,重复一至四步,第84页/共92
42、页2023-5-685第八章 相关与回归分析 ;本 章 小 结 本章介绍了相关与回归分析的各种理论和方法,并对大多数问题给出了实例。相关分析与回归分析的概念是这一章的基础,相关分析与回归分析既有区别又有联系,相关表和相关图是了解相关关系的重要工具。一元线性回归分析是回归分析的核心,回归分析都是在经典假设的基础上进行的,在经典回归下,最小二乘估计量具有线性、无偏性和有效性。在这些性质的基础上,可以得到最小二乘估计量的分布,由此可以对参数进行区间估计和假设检验。另外需要对回归方程的拟合程度进行检验。预测是一元线性回归的基本目的之一。第85页/共92页2023-5-686第八章 相关与回归分析 ;本
43、 章 小 结 多元线性回归的基本原理和一元线性回归是类似的,主要区别在于解释变量的多少。为了运算的方便,多元线性回归采用矩阵方法进行表示。非线性回归的概念存在一定误区,本章阐明了非线性回归分析的概念,并对可线性化的非线性回归模型和不可线性化的回归模型分别展开了讨论。相关分析包括简单相关系数的计算、复相关系数的计算和偏相关系数的计算。由于复相关系数和偏相关系数的计算方法依赖于回归分析,所以相关分析放在了最后一节。由于多元线性回归、非线性回归、复相关系数、偏相关系数的计算比较烦琐,且大部分统计软件均可完成操作,故本章的例题主要针对于一元线性回归分析和简单相关系数。第86页/共92页2023-5-6
44、87第八章 相关与回归分析 ;思考与练习 1.简述相关关系的种类。2.什么是相关分析?什么是回归分析?二者有什么区别与联系?3.简述相关表的种类。4.说明经典线性回归模型的基本假定。5.多元线性回归模型系数向量的普通最小二乘估计有哪些性质?6.多元线性回归模型检验的内容都有哪些?第87页/共92页2023-5-688第八章 相关与回归分析 ;思考与练习 年份1999 200020012002200320042005产量(万件)34444958677685利润(万元)25283436404246表8-10 1999-2005年产量与利润表 7.已知某厂19992005年产量和利润的数据如表8-1
45、0:第88页/共92页2023-5-689第八章 相关与回归分析 ;要求:(1)画出利润随产量变化的散点图;(2)建立利润对产量的一元线性回归方程;(3)对斜率的经济意义加以解释;(4)对建立的回归方程进行检验。8.设某种商品销售量Y、价格X和广告费用Z有下述关系:思考与练习 uZXY210第89页/共92页2023-5-690第八章 相关与回归分析 ;思考与练习 月份月份销售量销售量(公斤公斤)价格价格(元元/公斤公斤)广告费用广告费用(元元)123456789101112557090100901058011012511513013010090807070707065606055505.506.307.207.006.307.355.607.157.506.907.156.50表8-11 商品销售量、价格与广告费用数据第90页/共92页2023-5-691第八章 相关与回归分析 ;思考与练习 要求:(1)估计样本回归方程(2)对回归方程进行显著性检验(3)计算复相关系数(4)计算X和Z的偏相关系数(5)假如某月商品价格为80(元/公斤),广告费用为7(元),预测该商品的销售量,并建立95%的预测区间。第91页/共92页2023-5-6课件92谢谢您的观看!第92页/共92页