10-2一元回归分析课件.ppt

上传人(卖家):晟晟文业 文档编号:4740831 上传时间:2023-01-06 格式:PPT 页数:42 大小:661KB
下载 相关 举报
10-2一元回归分析课件.ppt_第1页
第1页 / 共42页
10-2一元回归分析课件.ppt_第2页
第2页 / 共42页
10-2一元回归分析课件.ppt_第3页
第3页 / 共42页
10-2一元回归分析课件.ppt_第4页
第4页 / 共42页
10-2一元回归分析课件.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

1、10.2 一元线性回归一元线性回归10.2.1 一元线性回归模型一元线性回归模型10.2.2 参数的最小二乘估计参数的最小二乘估计10.2.3 回归直线的拟合优度回归直线的拟合优度10.2.4 显著性检验显著性检验什么是回归分析?什么是回归分析?(Regression)从一组样本数据出发,确定变量之间的数从一组样本数据出发,确定变量之间的数学关系式学关系式对这些关系式的可信程度进行各种统计检对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著找出哪些变量的影响显著,哪些不显著利用所求的关系式,根据一个或几

2、个变量利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度值,并给出这种预测或控制的精确程度(置信度)。(置信度)。回归模型的类型回归模型的类型线线 性性 回回 归归非非 线线 性性 回回 归归一一 元元 回回 归归线线 性性 回回 归归非非 线线 性性 回回 归归多多 元元 回回 归归回回 归归 模模 型型一元线性回归模型一元线性回归模型回归模型回归模型(regression model)回答回答“变量之间是什么样的关系?变量之间是什么样的关系?”方程中运用方程中运用1 个数值型个数值型因变量因变量(响

3、应变量响应变量)被预测的变量被预测的变量1 个或多个数值型或分类型个或多个数值型或分类型自变量自变量(解释变量解释变量)用于预测的变量用于预测的变量3.主要用于预测和估计主要用于预测和估计一元线性回归一元线性回归涉及一个自变量的回归涉及一个自变量的回归因变量因变量y与自变量与自变量x之间为线性关系之间为线性关系被 预 测 或 被 解 释 的 变 量 称 为 因 变 量被 预 测 或 被 解 释 的 变 量 称 为 因 变 量(dependent variable),用,用y表示表示用来预测或用来解释因变量的一个或多个变用来预测或用来解释因变量的一个或多个变量称为自变量量称为自变量(indepe

4、ndent variable),用,用x表表示示 因变量与自变量之间的关系用一个线性方因变量与自变量之间的关系用一个线性方程来表示程来表示一元线性回归模型一元线性回归模型描述因变量描述因变量 y 如何依赖于如何依赖于自变量自变量 x 和误差项和误差项 的的方程称为方程称为回归模型回归模型一元线性回归模型可表示为一元线性回归模型可表示为 y=b b0 0+b b1 1 x+(理论回归模型)理论回归模型)y 是是 x 的线性函数的线性函数(部分部分)加上误差项加上误差项线性部分反映了由于线性部分反映了由于 x 的变化而引起的的变化而引起的 y 的变化的变化误差项误差项 是随机变量是随机变量反映了除

5、反映了除 x 和和 y 之间的线性关系之外的随机因素对之间的线性关系之外的随机因素对 y 的的影响影响是不能由是不能由 x 和和 y 之间的线性关系所解释的变异性之间的线性关系所解释的变异性b b0 和和 b b1 称为模型的参数(称为模型的参数(回归系数回归系数)一元线性回归模型一元线性回归模型(基本假定基本假定)(0均值)均值)误差项误差项是一个期望值为是一个期望值为0的随机变的随机变量,即量,即E()=0。对于一个给定的。对于一个给定的 x 值,值,y 的期望的期望值为值为 E(y)=b b 0+b b 1 x(方差齐性)(方差齐性)对于所有的对于所有的 x 值,值,的方差的方差2 都相

6、都相同同(独立性)(独立性)误差项误差项是一个服从正态分布的随机是一个服从正态分布的随机变量,且相互独立。即变量,且相互独立。即N(0,2)独立性意味着对于一个特定的独立性意味着对于一个特定的 x 值,它所对应的值,它所对应的与与其他其他 x 值所对应的值所对应的不相关不相关对于一个特定的对于一个特定的 x 值,它所对应的值,它所对应的 y 值与其他值与其他 x 所所对应的对应的 y 值也不相关值也不相关回归方程回归方程(regression equation)描述描述 y 的的平均值平均值或或期望值期望值如何依赖于如何依赖于 x 的方的方程称为程称为回归方程回归方程一元线性回归方程的形式如下

7、一元线性回归方程的形式如下 E(y)=b b0+b b1 x估计的回归方程估计的回归方程(estimated regression equation)0b1b0b1b0b1bxy10bb+0b1by 参数的最小二乘估计参数的最小二乘估计最小二乘估计最小二乘估计(图示图示)xy10bb+最小二乘估计最小二乘估计最小niiiniixyyy121012)()(bb0b1b最小二乘法最小二乘法(和和 的计算公式的计算公式)xyxxyyxxxxnyxyxnniiniiininiiiniiniiniii1012112121111)()(bbb1b0b0b1b在相关及回归分析中,为方便公式记忆,对三种离差和

8、在相关及回归分析中,为方便公式记忆,对三种离差和常用以下标记常用以下标记:2112211111211221)(1)(1)()(1)(niiniiniiyyniiniiniiiiniixyniiniiniixxynyyyLyxnyxyyxxLxnxxxL11101)1(1;bbbniiniixxxyxnynLL则:一元线性回归方程一元线性回归方程(例题分析)(例题分析)【例】为研究某一化学反应过程中,温度为研究某一化学反应过程中,温度x(0c)对对产品得率产品得率Y(%)的影响,测得数据如下:)的影响,测得数据如下:温度100110120130140150160170180190得率455154

9、61667074788589求Y关于x的线性回归方程。一元线性回归方程一元线性回归方程(例题分析)(例题分析)【解】现在n=10,为求线性回归方程,所需计算列表如下:序号序号xyx2y2xy1100451000020254500211051121002601561031205414400291664804130611690037217930514066196004356924061507022500490010500716074256005476118408170782890060841326091808532400722515300101908936100792116910一元线性回归方程一

10、元线性回归方程(例题分析)(例题分析)398567314501011015701)(8250)1450(101218500)(1)(11112211221niiniiniiiiniixyniiniiniixxyxnyxyyxxLxnxxxL1.1932)673(10147225)(1)(2211221niiniiniiyyynyyyL一元线性回归方程一元线性回归方程(例题分析)(例题分析)73935.248303.01450101673101)1(148303.08250398511101bbbniiniixxxyxnynLL则:y2.739350.48303x+于 是 得 到 回 归 直 线

11、 方 程 为:用用Excel进行回归分析进行回归分析第第1步:步:选择“工具工具”下拉菜单第第2步:步:选择“数据分析数据分析”选项第第3步:步:在分析工具中选择“回归回归”,然后选择“确确定定”第第4步:步:当对话框出现时 在“Y值输入区域值输入区域”设置框内键入Y的数据区域 在“X值输入区域值输入区域”设置框内键入X的数据区域 在“置信度置信度”选项中给出所需的数值 在“输出选项输出选项”中选择输出区域 在“残差残差”分析选项中选择所需的选项 用用Excel进行回归分析进行回归分析回归直线的拟合优度回归直线的拟合优度拟合优度拟合优度回归直线回归直线 在一定程度上描述了变量在一定程度上描述了

12、变量x与与y之间的数量关系,根据这一方程,可根据之间的数量关系,根据这一方程,可根据自变量自变量x的取值来估计因变量的取值来估计因变量y的取值。的取值。各观察点越是紧密围绕直线,说明直线对观各观察点越是紧密围绕直线,说明直线对观测数据的拟合程度越好,反之则越差。测数据的拟合程度越好,反之则越差。回归直线与各观测点的接近程度称为回归直回归直线与各观测点的接近程度称为回归直线对数据的线对数据的拟合优度拟合优度。拟合优度的好坏用拟合优度的好坏用判定系数(可决系数)判定系数(可决系数)来来衡量。衡量。xy10bb+变差变差因变量因变量 y 的取值是不同的,的取值是不同的,y 取值的这种波动称取值的这种

13、波动称为为变差变差。变差来源于两个方面。变差来源于两个方面由于自变量由于自变量 x 的取值不同造成的的取值不同造成的除除 x 以外的其他因素以外的其他因素(如如x对对y的非线性影响、的非线性影响、测量误差等测量误差等)的影响的影响对一个对一个具体的观测值来说,变差的大小可以通具体的观测值来说,变差的大小可以通过该实际观测值过该实际观测值 y 与其均值与其均值 之差之差 来表来表示示n次观察值的总变差可由这些变差的平方和来表次观察值的总变差可由这些变差的平方和来表示,称为总离差平方和,记为示,称为总离差平方和,记为SSTyyy _2()iyySSTyyL变差的分解变差的分解(图示图示)yxy10

14、bb+yyyyyy),(iiyx离差平方和的分解离差平方和的分解(三个平方和的关系三个平方和的关系)(+niiniiniiyyyyyy121212离差平方和的分解离差平方和的分解(三个平方和的意义三个平方和的意义)总离差平方和总离差平方和(SST)反映因变量的反映因变量的 n 个观察值与其均值的总离差个观察值与其均值的总离差回归平方和回归平方和(SSR)反映自变量反映自变量 x 的变化对因变量的变化对因变量 y 取值变化的影取值变化的影响,或者说,是由于响,或者说,是由于 x 与与 y 之间的线性关系引之间的线性关系引起的起的 y 的取值变化,也称为可解释的平方和的取值变化,也称为可解释的平方

15、和残差平方和残差平方和(SSE)反映除反映除 x 以外的其他因素对以外的其他因素对 y 取值的影响,也取值的影响,也称为不可解释的平方和或剩余平方和称为不可解释的平方和或剩余平方和_2()iyySSTyyL2_22211()nxyxxyyixxLSSRyyLr LLb2(1)yySSErL判定系数判定系数r2 (coefficient of determination)回归平方和占总离差平方和的比例(22221122111nniixyiinnxxyyiiiiyyyyLSSRRSSTL Lyyyy 反映回归直线的拟合程度反映回归直线的拟合程度取值范围在取值范围在 0,1 之间之间 R2 1,说明

16、回归方程拟合的越好;,说明回归方程拟合的越好;R20,说,说明回归方程拟合的越差明回归方程拟合的越差在一元线性回归中,判定在一元线性回归中,判定系数在数值上等于相关系数在数值上等于相关系数的平方,即系数的平方,即R2r2估计标准误差估计标准误差(standard error of estimate)实际观察值与回归估计值离差平方和的均方根实际观察值与回归估计值离差平方和的均方根反映实际观察值在回归直线周围的分散状况反映实际观察值在回归直线周围的分散状况是对误差项是对误差项 的标准差的标准差 的估计,是在排除了的估计,是在排除了x对对y的线性影响后,的线性影响后,y随机波动大小的一个估计量随机波

17、动大小的一个估计量反映用估计的回归方程预测反映用估计的回归方程预测y时预测误差的大小时预测误差的大小 计算公式为计算公式为(221(1)222niiyyiyyyrLSSEsMSEnnn一元线性回归方程一元线性回归方程(例题分析)(例题分析)【例】为研究某一化学反应过程中,温度x(0c)对产品得率Y(%)的影响,测得数据如下:温度100110120130140150160170180190得率45515461667074788589求Y关于x的线性回归方程及相应的判定系数。一元线性回归方程及判定系数一元线性回归方程及判定系数(例题分析)(例题分析)【解】现在n=10,为求线性回归方程,所需计算列

18、表如下:序号序号xyx2y2xy1100451000020254500211051121002601561031205414400291664804130611690037217930514066196004356924061507022500490010500716074256005476118408170782890060841326091808532400722515300101908936100792116910一元线性回归方程及判定系数一元线性回归方程及判定系数(例题分析)(例题分析)398567314501011015701)(8250)1450(101218500)(1)(111

19、12211221niiniiniiiiniixyniiniiniixxyxnyxyyxxLxnxxxL1.1932)673(10147225)(1)(2211221niiniiniiyyynyyyL一元线性回归方程及判定系数一元线性回归方程及判定系数(例题分析)(例题分析)73935.248303.01450101673101)1(148303.08250398511101bbbniiniixxxyxnynLL则:y2.739350.48303x+于是得到回归直线方程为:一元线性回归方程及判定系数一元线性回归方程及判定系数(例题分析)(例题分析)996260938.0998128718.01.

20、1932825039852rLLLryyxxxy判定系数相关系数显著性检验显著性检验线性关系的检验线性关系的检验检验自变量与因变量之间的线性关系是否检验自变量与因变量之间的线性关系是否显著显著将回归均方将回归均方(MSR)同残差均方同残差均方(MSE)加以比加以比较,应用较,应用F检验来分析二者之间的差别是检验来分析二者之间的差别是否显著否显著回归均方:回归平方和回归均方:回归平方和SSR除以相应的自由除以相应的自由度度(自变量的个数自变量的个数p,一元线性回归中自由度为一元线性回归中自由度为1)残差均方:残差平方和残差均方:残差平方和SSE除以相应的自由除以相应的自由度度(n-p-1,一元线

21、性回归中自由度为一元线性回归中自由度为n-2)线性关系的检验线性关系的检验(检验的步骤检验的步骤)提出假设H0:b1=0 线性关系不显著1(1,2)2SSRMSRFFnSSE nMSEF-统计量的计算统计量的计算222212(2)(1)(2)1yyyySSRMSRFSSE nMSEL rnLrrnr线性关系的检验线性关系的检验(例题分析例题分析)提出假设H0:b1=0 温度与产品得率之间的线性关系不显著计算检验统计量F221(2)1196.76521SSRrFnSSE nr回归系数的检验回归系数的检验1b回归系数的检验回归系数的检验(样本统计量样本统计量 的分布的分布)1b1b1b11)(bbE(21xxib1b(21xxssiyb11)(bbE(21xxssiyb回归系数的检验回归系数的检验(检验步骤检验步骤)提出假设提出假设H0:b b1=0(没有线性关系没有线性关系)H1:b b1 0(有线性关系有线性关系)计算检验的统计量计算检验的统计量)2(11ntstbb

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(10-2一元回归分析课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|