1、统计学原理统计学原理(第(第3 3版)版)2/49第九章第九章 相关与回归分析相关与回归分析n 第一节第一节 相关分析相关分析n 第二节第二节 一元线性回归分析一元线性回归分析n 第三节第三节 多元线性回归分析多元线性回归分析学学 习习 目目 标标3/49学习要点学习要点第一节第一节 相关分析相关分析 第九章第九章 相关与回归分析相关与回归分析l 1.相关关系的含义相关关系的含义l 2.相关关系的类型相关关系的类型l 3.相关关系的判断方法相关关系的判断方法l 4.Excel操作操作 4/49l函数关系与相关关系函数关系与相关关系还是还是?1.1.相关关系的含义相关关系的含义 第九章第九章 相
2、关与回归分析相关与回归分析5/49函数关系函数关系一个变量的取值由另一个一个变量的取值由另一个变量唯一确定,即变量间变量唯一确定,即变量间当变量当变量 取某个数值时,取某个数值时,依确定的关系取相应的值,依确定的关系取相应的值,则称则称 是是 的函数,记为的函数,记为 。各观测点都落在一条直线上各观测点都落在一条直线上 xyxy)(xfy 第九章第九章 相关与回归分析相关与回归分析1.1.相关关系的含义相关关系的含义6/49函数关系的例子函数关系的例子 某种商品的销售额某种商品的销售额y y与销售量与销售量x x之间的关之间的关系可表示为系可表示为 y=px (p 为为固定固定单价单价)圆的面
3、积圆的面积S S与半径之间的关系可表示为与半径之间的关系可表示为S S=R R2 2 第九章第九章 相关与回归分析相关与回归分析1.1.相关关系的含义相关关系的含义7/49相关关系相关关系(correlation)一个变量的取值不能一个变量的取值不能由另一个变量唯一确定由另一个变量唯一确定当变量当变量 取某个值时,取某个值时,变量变量 的取值可能有的取值可能有 几个几个各观测点分布在直线周围各观测点分布在直线周围 xy 第九章第九章 相关与回归分析相关与回归分析1.1.相关关系的含义相关关系的含义8/49相关关系的例子相关关系的例子父母身高父母身高 y 与子女身高与子女身高 x 之间的关系之间
4、的关系收入水平收入水平 y 与受教育程度与受教育程度 x 之间的关系之间的关系商品的消费量商品的消费量 y 与居民收入与居民收入 x 之间的关系之间的关系商品销售额商品销售额 y 与广告费支出与广告费支出 x 之间的关系之间的关系 第九章第九章 相关与回归分析相关与回归分析1.1.相关关系的含义相关关系的含义9/492.2.相关关系的类型相关关系的类型 第九章第九章 相关与回归分析相关与回归分析10/49 第九章第九章 相关与回归分析相关与回归分析2.2.相关关系的类型相关关系的类型11/49定性分析定性分析相关表相关表散点图散点图 相关系数相关系数 测定测定方法方法3.3.相关关系的判断方法
5、相关关系的判断方法 第九章第九章 相关与回归分析相关与回归分析12/49依赖于研究者依赖于研究者 的理论知识、的理论知识、经验和分析研经验和分析研 究能力。究能力。辨别真相关和伪相关辨别真相关和伪相关 第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法13/49相关表是根据现象变动的样本资料编制出相关表是根据现象变动的样本资料编制出来的反映变量间相互关系的统计表。来的反映变量间相互关系的统计表。相关表相关表 第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法14/49月份月份月销售收入月销售收入y电视广告费用电视广告费用x
6、165035259130357028454018557021656424752017856521959532106103011560251257025表表9-2 第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法15/49u将两变量相对应的变量值用坐标点形式描绘出将两变量相对应的变量值用坐标点形式描绘出来用以表明相关关系的图形,称为来用以表明相关关系的图形,称为相关图相关图u利用相关图可以:利用相关图可以:判断现象之间有无相关关系判断现象之间有无相关关系观察相关关系的类型观察相关关系的类型观察相关关系的密切程度观察相关关系的密切程度 相关图(或散点图)相关图
7、(或散点图)第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法16/49 第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法17/49相关系数相关系数(correlation coefficient)相关系数是说明两个变量之间在线性相关相关系数是说明两个变量之间在线性相关条件下相关关系密切程度的统计分析指标条件下相关关系密切程度的统计分析指标.r若相关系数是根据总体全部数据计算若相关系数是根据总体全部数据计算的,称为总体相关系数,记为的,称为总体相关系数,记为.若是根据样本数据计算的,则称若是根据样本数据计算的,则称为样本
8、相关系数,记为为样本相关系数,记为 .第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法18/49r的取值范围:的取值范围:0 r 1当当r0时,时,X与与Y正相关正相关当当r0时,时,X与与Y负相关负相关当当r0时,时,X与与Y之间不存在之间不存在线性线性相关关系相关关系当当r1时,时,X与与Y之间完全正线性关系之间完全正线性关系当当r-1时,时,X与与Y之间完全负线性关系之间完全负线性关系相关系数的取值相关系数的取值 第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法19/490 0r r0.3 0.3,X X与与Y
9、Y弱弱线性相关线性相关0.30.3r r0.5 0.5,X X与与Y Y低度低度线性相关线性相关0.50.5r r0.80.8,X X与与Y Y显著显著线性相关线性相关0.80.8r r1 1,X X与与Y Y高度高度线性相关线性相关相关系数的取值相关系数的取值 第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法20/492222)()(yynxxnyxxynr 第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法相关系数相关系数r的计算公式的计算公式21/49月份月份月销售收入月销售收入y电视广告费用电视广告费用x xy
10、x2 y216503522 7501 225422 50025913017 730900349 28135702815 960784324 9004540189 720324291 60055702111 970441324 90065642413 536576318 0967520178 840289270 40085652111 865441319 22595953219 0401 024354 025106103018 300900372 100115602514 000625313 600125702514 250625324 900合计合计6905306177 9618 154398
11、5 5272212 177961 306 69050.907 412 851430612 39855276905r高度正相关高度正相关表表9-222/49为什么进行为什么进行相关系数的相关系数的显著性检验?显著性检验?r的显著性检验通常采用费希尔的显著性检验通常采用费希尔(R.A.Fisher)提出的提出的t分布检验。分布检验。相关系数的显著性检验相关系数的显著性检验检验两个变量之间是否存在线性相关关系检验两个变量之间是否存在线性相关关系为什么进行为什么进行相关系数的相关系数的显著性检验?显著性检验?r的显著性检验通常采用费希尔的显著性检验通常采用费希尔(R.A.Fisher)提出的提出的t分
12、布检验。分布检验。第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法23/49检验的步骤为:检验的步骤为:q 提出假设:提出假设:H H0 0:;H H1 1:0 0计算检验的统计量:计算检验的统计量:确定显著性水平确定显著性水平,并作出决策,并作出决策 若若t t t t,拒绝,拒绝H H0 0 若若t t t t,不能拒绝,不能拒绝H H0 0相关系数的显著性检验相关系数的显著性检验 第九章第九章 相关与回归分析相关与回归分析3.3.相关关系的判断方法相关关系的判断方法24/49运用运用ExcelExcel、SPSSSPSS等软件等软件我们可以轻我们可以
13、轻松地得到相松地得到相关系数及其关系数及其检验结果。检验结果。4.4.相关分析的相关分析的ExcelExcel操作操作 第九章第九章 相关与回归分析相关与回归分析25/49 将相关的两列数据输入将相关的两列数据输入ExcelExcel表格表格“数据数据”“相关系数相关系数”散点图散点图相关系数相关系数“数据分析数据分析”“插入插入”“散点图散点图”“图表图表”第九章第九章 相关与回归分析相关与回归分析4.4.相关分析的相关分析的ExcelExcel操作操作26/49学习要点学习要点第二节第二节 一元线性回归分析一元线性回归分析l 1.1.回归分析的含义回归分析的含义l 2.2.一元线性回归方程
14、一元线性回归方程l 3.3.参数的最小二乘估计参数的最小二乘估计l 4.4.拟合优度与显著性检验拟合优度与显著性检验l 5.5.一元线性回归预测一元线性回归预测l 6.Excel6.Excel操作操作 第九章第九章 相关与回归分析相关与回归分析27/49l回归分析回归分析(Regression)回归分析是对具有密切关系的两个变量,回归分析是对具有密切关系的两个变量,根据其相关形式,选择一个合适的数学关根据其相关形式,选择一个合适的数学关系式来近似地表现变量之间平均变化程度系式来近似地表现变量之间平均变化程度的一种统计分析方法。的一种统计分析方法。1.1.回归分析的含义回归分析的含义 第九章第九
15、章 相关与回归分析相关与回归分析28/49l回归分析与相关分析的联系回归分析与相关分析的联系相关关系是回归分析的前提,相关关系是回归分析的前提,回归分析是相关分析的深入。回归分析是相关分析的深入。u 相关分析是回归分析的前提相关分析是回归分析的前提,对于相关程度很低,对于相关程度很低的两个变量进行回归分析是没有实际意义的的两个变量进行回归分析是没有实际意义的u 回归分析是建立在相关分析的基础上回归分析是建立在相关分析的基础上,对于具有,对于具有密切相关的两个变量进行深入分析,建立它们之密切相关的两个变量进行深入分析,建立它们之间的数学关系式,并进行统计推断,是相关分析间的数学关系式,并进行统计
16、推断,是相关分析的拓展的拓展 第九章第九章 相关与回归分析相关与回归分析1.1.回归分析的含义回归分析的含义29/49l回归分析的内容回归分析的内容u从一组样本数据出发,估计回归参数,从一组样本数据出发,估计回归参数,建立回归建立回归模型模型;u对这些关系式的可信程度进行各种对这些关系式的可信程度进行各种统计检验统计检验,并,并从影响某一特定变量的诸多变量中找出哪些变量从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著的影响显著,哪些不显著u利用所求的关系式,根据一个或几个变量的取值利用所求的关系式,根据一个或几个变量的取值来来预测或控制预测或控制另一个特定变量的取值,并给出这另
17、一个特定变量的取值,并给出这种预测或控制的精确程度种预测或控制的精确程度 第九章第九章 相关与回归分析相关与回归分析1.1.回归分析的含义回归分析的含义30/49线线 性性 回回 归归非非 线线 性性 回回 归归一一 元元 回回 归归线线 性性 回回 归归非非 线线 性性 回回 归归多多 元元 回回 归归回回 归归 模模 型型2.2.一元线性回归方程一元线性回归方程 第九章第九章 相关与回归分析相关与回归分析31/49l涉及涉及一个自变量一个自变量的回归的回归l因变量因变量 y 与自变量与自变量 x 之间为之间为线性关系线性关系l被预测或被解释的变量称为因变量,被预测或被解释的变量称为因变量,
18、用用 y 表示表示l用来预测或用来解释因变量的一个或多个变量用来预测或用来解释因变量的一个或多个变量称为自变量,用称为自变量,用 x 表示表示 l因变量与自变量之间的关系用一个因变量与自变量之间的关系用一个线性方程线性方程来表示来表示n一元线性回归方程一元线性回归方程 第九章第九章 相关与回归分析相关与回归分析2.2.一元线性回归方程一元线性回归方程32/49l 一元线性回归方程可表示为一元线性回归方程可表示为bxay其中:其中:a 是估计的回归直线在是估计的回归直线在y轴上的截距;轴上的截距;b 是直线的斜率,是直线的斜率,y 第九章第九章 相关与回归分析相关与回归分析2.2.一元线性回归方
19、程一元线性回归方程33/493.3.参数的最小二乘估计参数的最小二乘估计n参数的最小二乘估计参数的最小二乘估计 第九章第九章 相关与回归分析相关与回归分析34/49 第九章第九章 相关与回归分析相关与回归分析3.3.参数的最小二乘估计参数的最小二乘估计35/49xbyaxxnyxxynb22)(0202bxayxbQbxayaQ 第九章第九章 相关与回归分析相关与回归分析3.3.参数的最小二乘估计参数的最小二乘估计36/49yxx y2x月份月份月销售收入月销售收入(万元)(万元)电视广告费电视广告费用(万元)用(万元)1 1650650353522 75022 7501 2251 2252
20、2591591303017 73017 7309009003 3570570282815 96015 9607847844 454054018189 7209 7203243245 5570570212111 97011 9704414416 6564564242413 53613 5365765767 752052017178 8408 8402892898 8565565212111 86511 8654414419 9595595323219 04019 0401 0241 0241010610610303018 30018 3009009001111560560252514 00014
21、 0006256251212570570252514 25014 250625625合计合计6 9056 905306306177 961177 9618 1548 154表表9-4xbyaxxnyxxynb22)(58.43837.5ab 第九章第九章 相关与回归分析相关与回归分析3.3.参数的最小二乘估计参数的最小二乘估计37/49p月销售收入与电视广告费用的回归方程月销售收入与电视广告费用的回归方程 5812.43812306366.5126905366097.5306815412690530617796112)(222xbyaxxnyxxynbxy37.558.438回归系数回归系数
22、b=5.37 表示电视广告投入每增加表示电视广告投入每增加1万万元,销售收入平均增加元,销售收入平均增加5.37万元。万元。第九章第九章 相关与回归分析相关与回归分析3.3.参数的最小二乘估计参数的最小二乘估计38/494.4.拟合优度与显著性检验拟合优度与显著性检验(1)拟合优度)拟合优度n 判定系数判定系数R2 R2的取值范围是(的取值范围是(0,1)越接近于越接近于1,表明回归直线拟合程度越好;反之,表明回归直线拟合程度越好;反之,拟合程度越差。拟合程度越差。在一元线性回归中,判定系数在一元线性回归中,判定系数R2实际上是相关系数实际上是相关系数r的平的平方,相关系数与回归系数的正负号也
23、是相同的。方,相关系数与回归系数的正负号也是相同的。n 估计标准误差估计标准误差 2()1eyySnk222()()SSRyyRSSTyy一般:一般:yse15%第九章第九章 相关与回归分析相关与回归分析39/49根据表根据表9-4判定系数判定系数 222()101090.823482.34%12 277()SSRyyRSSTyy估计标准误差估计标准误差 2()216814.721121 1eyySnk(万元)(万元)%56.242.57572.14yse15%第九章第九章 相关与回归分析相关与回归分析4.4.拟合优度与显著性检验拟合优度与显著性检验40/49(2)显著性检验)显著性检验n F
24、 检验检验 n t 检验检验 检验变量检验变量 x 和和 y 之间的线性关系是否显著之间的线性关系是否显著检验自变量检验自变量 x 对对 因变量因变量 y 的影响是否显著的影响是否显著Significance F ,表明自变量与因变量之间有显著的线性关系,表明自变量与因变量之间有显著的线性关系 P-value ,表明自变量对因变量的影响是显著的,表明自变量对因变量的影响是显著的 通常取通常取0.05 或或0.01 第九章第九章 相关与回归分析相关与回归分析4.4.拟合优度与显著性检验拟合优度与显著性检验41/49n利用利用Excel输出结果建立回归方程,并对回归方程的输出结果建立回归方程,并对
25、回归方程的检验结果进行判断检验结果进行判断上例中:上例中:第九章第九章 相关与回归分析相关与回归分析4.4.拟合优度与显著性检验拟合优度与显著性检验42/495.5.一元线性回归预测一元线性回归预测一元线性回归预测的方法:一元线性回归预测的方法:点估计点估计区间估计区间估计 点估计点估计点估计是利用估计的回归方程,给点估计是利用估计的回归方程,给x一个特定值一个特定值x0,求出求出y的一个估计值。的一个估计值。【例例9-5】将将x0=40带入方程,得销售额为带入方程,得销售额为:0438.58125.366 097 40653.23y(万元)(万元)第九章第九章 相关与回归分析相关与回归分析4
26、3/49 区间估计区间估计区间估计是利用估计的回归方程,给区间估计是利用估计的回归方程,给 x 一个特定值一个特定值 x0,求,求出出 y 的一个估计值区间。的一个估计值区间。l 置信区间置信区间:对:对 x 的给定值的给定值 x0,求,求 y 的平均值的估计区间的平均值的估计区间 200/22()1()exxytSnxxl 预测区间预测区间:对:对 x 的给定值的给定值 x0,求,求 y 的一个个别值的估计区间的一个个别值的估计区间 200/22()11()exxytSnxx 第九章第九章 相关与回归分析相关与回归分析5.5.一元线性回归预测一元线性回归预测44/496.Excel6.Exc
27、el操作操作回归分析的回归分析的Excel路径:路径:“数据数据”“”“数据分析数据分析”“”“回归回归”第九章第九章 相关与回归分析相关与回归分析45/49第三节第三节 多元线性回归分析多元线性回归分析1.1.多元线性回归模型多元线性回归模型 第九章第九章 相关与回归分析相关与回归分析2.2.多元线性回归方程的拟合优度检验多元线性回归方程的拟合优度检验3.3.多元线性回归方程的显著性检验多元线性回归方程的显著性检验 46/4901 12 2k kybb xb xb x式中式中:为因变量的估计值;为因变量的估计值;为为 k 个自变量;个自变量;为常数项,是回归直线在为常数项,是回归直线在 y
28、轴上的截距;轴上的截距;为为 k 个偏回归系数,是回归直线的斜率,表个偏回归系数,是回归直线的斜率,表示当其他自变量取值不变时,自变量示当其他自变量取值不变时,自变量 每改变一个单位,每改变一个单位,的的平均变动量。平均变动量。y12kxxx、0b12kbbb、ix y 第九章第九章 相关与回归分析相关与回归分析1.1.多元线性回归模型多元线性回归模型47/492.2.多元线性回归方程的拟合优度多元线性回归方程的拟合优度多元判定系数多元判定系数R2 估计标准误差估计标准误差 2()1eyySnk21SSRSSERSSTSST 第九章第九章 相关与回归分析相关与回归分析3.3.多元线性回归方程的显著性检验多元线性回归方程的显著性检验 F检验检验 t 检验检验 检验检验 k 个自变量与因变量个自变量与因变量 y 之间的线性关系是否显著之间的线性关系是否显著检验检验 某某 个自变量对因变量个自变量对因变量 y 的影响是否显著的影响是否显著多元线性回归实例多元线性回归实例 第九章第九章 相关与回归分析相关与回归分析48/49第九章第九章 要点回顾要点回顾49/49
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。