相关分析和回归分析1课件.ppt

上传人(卖家):晟晟文业 文档编号:5166158 上传时间:2023-02-15 格式:PPT 页数:61 大小:1.50MB
下载 相关 举报
相关分析和回归分析1课件.ppt_第1页
第1页 / 共61页
相关分析和回归分析1课件.ppt_第2页
第2页 / 共61页
相关分析和回归分析1课件.ppt_第3页
第3页 / 共61页
相关分析和回归分析1课件.ppt_第4页
第4页 / 共61页
相关分析和回归分析1课件.ppt_第5页
第5页 / 共61页
点击查看更多>>
资源描述

1、相关分析与回归分析相关分析与回归分析编辑ppt2本章要点 1、相关关系与非相关关系的区别、相关关系与非相关关系的区别 2、相关系数的计算、相关系数的计算 3、最小二乘法、最小二乘法 4、一元线性回归、一元线性回归 5、判定系数与回归系数、判定系数与回归系数 6、回归方程的检验、回归方程的检验 7、回归估计与预测、回归估计与预测编辑ppt39.1 相关分析概述相关分析概述Outline of Correlation Analysis编辑ppt49.1.1 相关分析的意义相关分析的意义 相关和回归分析是研究事物的相互关系、相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的测定

2、它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是构造各具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、种经济模型、进行结构分析、政策评价、预测和控制的重要工具。预测和控制的重要工具。编辑ppt5比较下面两种现象间的依存关系比较下面两种现象间的依存关系 出租汽车费用与行驶里程:出租汽车费用与行驶里程:总费用总费用=行驶里程行驶里程 每公里单价每公里单价PKG 家庭收入与恩格尔系数:家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。函数关系函数关系(确定性关系)(确定性关系)相关关系相关关系(非确定性关系)(非确定性关系)编辑ppt

3、6依存关系有两种类型依存关系有两种类型编辑ppt7 现象之间的相互联系,在许多情现象之间的相互联系,在许多情况下表现为一定的因果关系,将况下表现为一定的因果关系,将这些现象数量化则成为变量:这些现象数量化则成为变量:自变量自变量X因变量因变量Y编辑ppt8按涉及变量的多少分为按涉及变量的多少分为按照表现形式不同分为按照表现形式不同分为按照变化方向不同分为按照变化方向不同分为一元相关一元相关多元相关多元相关直线相关直线相关曲线相关曲线相关负相关负相关正相关正相关编辑ppt9定性分析定性分析定量分析定量分析编辑ppt10编辑ppt11 又称又称,用直角坐标系的,用直角坐标系的x轴代表自变量,轴代表

4、自变量,y轴代表因变量,将两个变轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。来,用以表明相关点分布状况的图形。编辑ppt12xy正正 相相 关关Positive Correlation负负 相相 关关Negative Correlation曲线相关曲线相关Other correlation不不 相相 关关Zero Correlationxyxyxy编辑ppt13 2222222)(yynxxnyxxynnyynxxnyyxxSSSryxxy 在在的条件下,用以反映两变量间的条件下,用以反映两变量间密切程度的

5、统计指标,用密切程度的统计指标,用r表示表示编辑ppt14相关系数相关系数r r的取值范围:的取值范围:r0 为为正相关正相关,r 0 为为负相关负相关;|r|=0 表示不存在表示不存在关系;关系;|r|1 表示表示完全完全相关相关;|r|0.4 为低度线性相关;为低度线性相关;0.4|r|0.7为显著性线性相关;为显著性线性相关;0.7|r|1.0为为高度高度显著性线性相关。显著性线性相关。编辑ppt15102 r判定系数取值范围:判定系数取值范围:r2越接近于越接近于1 1,表明,表明x x与与y y之间的相之间的相关性越强;关性越强;r2越接近于越接近于0 0,表明两,表明两个变量之间几

6、乎没有直线相关关系个变量之间几乎没有直线相关关系.是相关系数的平方,用是相关系数的平方,用r2 表示;用来衡量表示;用来衡量回归方程对回归方程对y的解释程度。的解释程度。编辑ppt16编辑ppt17 952009757097570625261751691655086166259163788716261755508637887625916162222222222.)(,ryynxxnyxxynryxxyyxn解解:已已知知结论:结论:工业总产值与能源消耗量之间存工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量在高度的正相关关系,能源消耗量x的变的变化能够解释工业总产值化能够解释工业总产

7、值y变化的变化的95.2。编辑ppt189.2一元线性回归分析一元线性回归分析Simple Linear Regression Analysis编辑ppt19回归分析回归分析指根据相关关系的数量表达指根据相关关系的数量表达式(回归方程式)与给定的式(回归方程式)与给定的自变量自变量x x(independent(independent variable)variable),揭示,揭示因变量因变量y y(dependent variable)(dependent variable)在在数量上的平均变化和求得因数量上的平均变化和求得因变量的预测值的统计分析方变量的预测值的统计分析方法法回归:退回回

8、归:退回regression编辑ppt20 理论和方法具有一致性;理论和方法具有一致性;无相关就无回归,相关程度越高,回归越无相关就无回归,相关程度越高,回归越好;好;相关系数和回归系数方向一致,可以互相相关系数和回归系数方向一致,可以互相推算。推算。编辑ppt21 相关分析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要要确定自变量和因变量;确定自变量和因变量;相关分析中相关分析中x、y均为随机变量,回归分析均为随机变量,回归分析中只有中只有y为随机变量;为随机变量;相关分析测定相关程度和方向,回归分析相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。用回归模型进行

9、预测和控制。编辑ppt22一一 元元线线性性回回归归Simple Linear regression编辑ppt23 XY为为随随机机误误差差项项为为模模型型参参数数,与与式式中中:XYEY 编辑ppt24)(YEXXY 截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为0编辑ppt25 XYEY bxay 以样本统计量估计总体参数以样本统计量估计总体参数斜率(回归系数)斜率(回归系数)截距截距截距截距a 表示在没有自变量表示在没有自变量x的影响时,其它各的影响时,其它各种因素对因变量种因素对因变量y的平均影响;的平均影响;回归系数回归系数b 表表明自

10、变量明自变量x每变动一个单位,因变量每变动一个单位,因变量y平均变平均变动动b个单位。个单位。编辑ppt26iiiiybxayyyxbxay )(值值应应为为的的实实际际而而变变量量之之间间的的平平均均变变动动关关系系,变变量量与与是是理理论论模模型型,表表明明编辑ppt27bxay dxcy 残差残差(Residual):e编辑ppt28bxay 基本数学要求:基本数学要求:min)(20yyyy 0201222xbxaybxaybabxayyy,有有求求偏偏导导数数,并并令令其其为为零零、分分别别对对函函数数中中,有有由由min,min)(最小平方法最小平方法Ordinary Least

11、Square Estimation编辑ppt29 2xbxaxyxbnay xbynxbnyaxxnyxxynb22)(编辑ppt3095200975702.,.rr ,5508637887625916162xxyyxn由计算表知由计算表知bxay 编辑ppt31 514261691679610166257961091655086166259163788716222.xbyaxxnyxxynbxy7961.05142.6编辑ppt32 残差之和为零残差之和为零0 e 所拟合直线通过样本散点图的重心所拟合直线通过样本散点图的重心 误差项与解释变量不相关误差项与解释变量不相关 a与与b分别是总体回

12、归系数的无偏估计量分别是总体回归系数的无偏估计量 a与与b均为服从正态分布的随机变量均为服从正态分布的随机变量),(yx0 )(xxee )()(bEaE)(,()(,(22222xxNbxxxNa 编辑ppt33xy0 x1xx 2xx 3xx xyE )()(yf xy0)(E0),(jiCov 2 )()(iiyVarVar0),(iixCov)(iyE)(iyf编辑ppt34 r0 r0 r=0b0 b0 b=0 xyyxSSrbSSbr ;编辑ppt352222)()(yynxxnyxxynr2rbr)(的的符符号号)()()(222222 yynxxnyxxynr判定系数与相关系数

13、的关系判定系数与相关系数的关系编辑ppt36无方向性,无方向性,则有方向,则有方向,其方向与样本回归系数其方向与样本回归系数 b 相同;相同;说明变量值的总离差平方和中可说明变量值的总离差平方和中可以用回归线来解释的比例,以用回归线来解释的比例,只说只说明两变量间关联程度及方向;明两变量间关联程度及方向;有夸大变量间相关程度的倾向,有夸大变量间相关程度的倾向,因而因而是更好的度量值。是更好的度量值。编辑ppt37编辑ppt38 是因变量各实际值与其估计值之间的平均差是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值代表性的异程度,表明其估计值对各实际值代表性的强弱;其值越小,

14、回归方程的代表性越强,强弱;其值越小,回归方程的代表性越强,用回归方程估计或预测的结果越准确。用回归方程估计或预测的结果越准确。2222 nenyySe)(一般的规律是:一般的规律是:自由度自由度=n-待估参数的个数待估参数的个数编辑ppt39 亿亿元元,且且知知解解:已已知知45722796105142626175378876251622.,.,nxybyaySbayxyynenxybyaynyySe 22)(编辑ppt40yy yy yy yy 2)(yyTSS 2)(yyRSS 2)(yyESS残差平方和残差平方和解释解释平方和平方和总离差平方和总离差平方和编辑ppt41 22)(yyn

15、TSS222)()(xxnyxxynESS 2)(bxayRSS编辑ppt42 22211)()(yyyyTSSRSSR2221yeSSR 22 nyy)(12 nyy)(编辑ppt43Adjusted R Square调整过的判定系数)/()/(112 nTSSknRSSR22211111RknnknkRknnR )(编辑ppt44提出假设:提出假设:0010 :HH目的目的检验检验两变量间线性相关性是否显著两变量间线性相关性是否显著步步骤骤构造检验统计量:构造检验统计量:)(2122 ntrnrt编辑ppt45 给定显著性水平给定显著性水平,确定临界值确定临界值 ;2 t 计算检验统计量并

16、做出决策。计算检验统计量并做出决策。22 ntt 22 ntt 步步骤骤编辑ppt46 线性相关性显著。,表示总体的两变量间拒绝有:00250221448214266161666161697570121697570Htnttt .00050975701610 :,.,.,HHrn提提出出假假设设:则则解解:已已知知00 :H当当 成立时,则统计量成立时,则统计量)(2122 ntrnrt编辑ppt47Estimation and Forecasting 估计的前提估计的前提:回归方程经过检验,证明:回归方程经过检验,证明 X 和和 Y 的关系在统计上是显著相关的。的关系在统计上是显著相关的。对

17、于给定的对于给定的 X 值,求出值,求出 Y 平均值的平均值的一个估计值或一个估计值或 Y 的一个个别值的预测值。的一个个别值的预测值。对于给定的对于给定的 X 值,求出值,求出 Y 的平均的平均值的置信区间或值的置信区间或 Y 的一个个别值的预测区的一个个别值的预测区间。间。编辑ppt480 xbxay yxxy7961051426.对对于于若若 x=80(十万吨),则:(十万吨),则:亿亿元元173857807961051426.yPoint Estimation编辑ppt49ybxay x0 x对于给定的对于给定的 x=x0,Y 的的1-置信区间为:置信区间为:自由度为自由度为n-2In

18、terval Estimationyty 20编辑ppt50nxxxxnty22202011)()(22 nyySe)(222020 nyyZySZye)(10-51n利用利用估计的回归方程,对于自变量估计的回归方程,对于自变量 x 的一个给定的一个给定值值 x0,求出因变量,求出因变量 y 的的平均值的估计区间平均值的估计区间,这,这一估计区间称为一估计区间称为置信区间(confidence interval)n E(y0)在在1-置信置信水平下的置信区间为水平下的置信区间为平均值的估计区间平均值的估计区间 niiexxxxnsnty12202012)(式中:式中:se为估计标准误差为估计标

19、准误差10-52置信区间置信区间、预测区间预测区间、回归方程回归方程xpbxay yxx预测上限预测上限置信上限置信上限预测下限预测下限置信下限置信下限编辑ppt53能 源 消 耗 量807060504030工业总产值6050403020SPSS输出结果(一)输出结果(一)编辑ppt54Model Summary.976a.952.9492.4567Model1RR SquareAdjustedR SquareStd.Errorof theEstimatePredictors:(Constant),能源消耗量a.ANOVAb1676.4401 1676.440277.761.000a84.49

20、8146.0361760.93815RegressionResidualTotalModel1Sum ofSquaresdfMeanSquareFSig.Predictors:(Constant),能源消耗量a.Dependent Variable:工业总产值b.SPSS输出结果(二)输出结果(二)编辑ppt55Coefficientsa-6.5162.803-2.325.036.796.048.97616.666.000(Constant)能源消耗量Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstS

21、ig.Dependent Variable:工业总产值a.SPSS输出结果(三)输出结果(三)编辑ppt5635.0024.0021.34872-1.6755718.71588 23.9815738.0025.0023.73710-1.4496521.36539 26.1088140.0024.0025.32935-1.2990423.12509 27.5336042.0028.0026.92160-1.1484224.87796 28.9652349.0032.0032.49447-.6212830.92932 34.0596252.0031.0034.88284-.3953633.4599

22、7 36.3057254.0037.0036.47509-.2447535.11637 37.8338259.0040.0040.45572.1317939.12628 41.7851662.0041.0042.84409.3577141.43978 44.2484164.0040.0044.43634.5083242.94855 45.9241365.0047.0045.23247.5836343.69437 46.7705668.0050.0047.62084.8095545.90378 49.3379169.0049.0048.41697.8848546.63245 50.2014871

23、.0051.0050.00922 1.0354748.08053 51.9379072.0048.0050.80534 1.1107748.80060 52.8100876.0058.0053.98984 1.4120051.66055 56.31912非标准预测值非标准预测值标准预测值标准预测值下限下限上限上限编辑ppt57八个同类工业企业的月产量与生产费用八个同类工业企业的月产量与生产费用编辑ppt58(百万元)(百万元)(吨)(吨)YfXf20个同类工业企业固定资产原值与平均每昼夜产量个同类工业企业固定资产原值与平均每昼夜产量编辑ppt59编辑ppt60重点习题重点习题1116192324编辑ppt61STATISTICS

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(相关分析和回归分析1课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|