高中数学人教A版选修1-2课件:1.1《回归分析》课时1 .ppt

上传人(卖家):金钥匙文档 文档编号:744919 上传时间:2020-09-15 格式:PPT 页数:30 大小:756KB
下载 相关 举报
高中数学人教A版选修1-2课件:1.1《回归分析》课时1 .ppt_第1页
第1页 / 共30页
高中数学人教A版选修1-2课件:1.1《回归分析》课时1 .ppt_第2页
第2页 / 共30页
高中数学人教A版选修1-2课件:1.1《回归分析》课时1 .ppt_第3页
第3页 / 共30页
高中数学人教A版选修1-2课件:1.1《回归分析》课时1 .ppt_第4页
第4页 / 共30页
高中数学人教A版选修1-2课件:1.1《回归分析》课时1 .ppt_第5页
第5页 / 共30页
点击查看更多>>
资源描述

1、3.13.1 回归分析的基本思想回归分析的基本思想 及其初步应用及其初步应用 (第一课时)(第一课时) 1 1通过典型案例的探究通过典型案例的探究,进一步了解回归分析的基本思想进一步了解回归分析的基本思想、 方法及其初步应用方法及其初步应用 2 2让学生经历数据处理的过程让学生经历数据处理的过程,培养他们对数据的直观感培养他们对数据的直观感 觉觉,体会统计方法的特点体会统计方法的特点,认识统计方法的应用认识统计方法的应用,通过使用转化通过使用转化 后的数据后的数据,求相关指数求相关指数,运用相关指数进行数据分析运用相关指数进行数据分析、处理的方处理的方 法法 3 3从实际问题中发现已有知识的不

2、足从实际问题中发现已有知识的不足,激发好奇心激发好奇心,求知求知 欲欲,通过寻求有效的数据处理方法通过寻求有效的数据处理方法,开拓学生的思路开拓学生的思路,培养学生培养学生 的探索精神和转化能力的探索精神和转化能力,通过案例的分析使学生了解回归分析在通过案例的分析使学生了解回归分析在 实际生活中的应用实际生活中的应用,增强数学取之生活增强数学取之生活,用于生活的意识用于生活的意识,提高提高 学习兴趣学习兴趣 本节课通过必修本节课通过必修3 3熟悉有例题回顾线性相关关系知熟悉有例题回顾线性相关关系知 识识,通过实际问题中发现已有知识的不足通过实际问题中发现已有知识的不足,引出随机引出随机 误差误

3、差、残差残差、残差分析的概念残差分析的概念,进而运用残差来进行进而运用残差来进行 数据分析数据分析,通过例题讲解掌握用残差分析判断线性回通过例题讲解掌握用残差分析判断线性回 归模型的拟合效果归模型的拟合效果。掌握建立回归模型的步骤掌握建立回归模型的步骤。 本节内容学生内容不易掌握本节内容学生内容不易掌握,通过知识整理与比通过知识整理与比 较引导学生进行区分较引导学生进行区分、理解理解。通过对典型案例的探究通过对典型案例的探究, 练习进行巩固了解回归分析的基本思想方法和初步应练习进行巩固了解回归分析的基本思想方法和初步应 用用 从某大学中随机选取从某大学中随机选取8 8名女大学生名女大学生,其身

4、高和体重数其身高和体重数 据如下表所示:据如下表所示: 怎样根据一名女大学生的身高预报她的体重怎样根据一名女大学生的身高预报她的体重,并预并预 报一名身高为报一名身高为172172 cmcm的女大学生的体重的女大学生的体重? 编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 n ii i 1 n 2 i i 1 b aybx. xxyy xx $ $ 根据必修根据必修3 2.33 2.3变量相关关系解决这个问题的方法:变量相关关系解决这个问题的方法: 1.1.先判断是两个

5、变量是否具有线性相关关系先判断是两个变量是否具有线性相关关系 (1)(1)作散点图,如图所示作散点图,如图所示( (见课本见课本P82P82:图:图3.13.1- -1)1) 2.2.根据线性回归的系数公式,根据线性回归的系数公式, 求回归直线方程求回归直线方程 0.849x0.849x- -85.71285.712 y $ 3.3.由线性回归方程可以估计其位由线性回归方程可以估计其位 置值为置值为 60.316(60.316(千克千克) )左右。左右。 y $ 具有较好的线性相关关系具有较好的线性相关关系 性质:回归直线一定过样本中心点性质:回归直线一定过样本中心点 (2)(2)计算计算相关

6、系数相关系数 这些点并不都在同一条直线上这些点并不都在同一条直线上,上述直线并不能精确上述直线并不能精确 地反映地反映x与与y之间的关系之间的关系,y 的值不能完全由的值不能完全由x 确定确定, 它们之间是统计相关关系它们之间是统计相关关系,y 的实际值与估计值之间的实际值与估计值之间 存在着误差存在着误差 因此因此, ,在统计学中设它们的线性回归模型为在统计学中设它们的线性回归模型为: : ybxae 其中其中a,ba,b为模型的未知参数为模型的未知参数,e,e为为y y与与bx+abx+a之间的误差之间的误差, 称它为随机误差称它为随机误差,它是随机变量它是随机变量。且且 2 E e0,D

7、 e 线性回归模型完整表达式为线性回归模型完整表达式为 2 ybxae E e0,D e, , x x称为称为_变量变量,y,y称为称为_变量变量. . 解释解释 预报预报 线性回归模型中随机误差的主要来源线性回归模型中随机误差的主要来源 线性回归模型中的预报值线性回归模型中的预报值 与真实情况与真实情况y y 引起的误差;引起的误差; 观测与计算观测与计算( (用用 代替代替b a)b a)产生的误差;产生的误差; 省略了一些因素的影响省略了一些因素的影响( (如生活习惯等)如生活习惯等) 产生的误差产生的误差. . y $ ba $ 在线性回归模型中,在线性回归模型中,e e为用为用bx+

8、abx+a的预报真实值的预报真实值y y的随机的随机 误差,它是一个不可观测的量,那么应该怎样研究随误差,它是一个不可观测的量,那么应该怎样研究随 机误差?机误差? 在实际应用中,我们用在实际应用中,我们用 估计估计 bx+a ybxa $ ey- bxa 所以所以 的估计量为的估计量为 e yy $ ii x ,yi1,2,3,nL 对于样本点对于样本点 iii eybxai1,2,3,nL iiiii eyyybxan1,2,3,n $ L 它们的随机误差为它们的随机误差为 估计值为估计值为 称相应于点称相应于点 的残差的残差 iii ex ,y 坐标纵轴为残差变量,横轴可以有不同的选择;

9、坐标纵轴为残差变量,横轴可以有不同的选择; 若模型选择的正确若模型选择的正确,残差图中的点应该分布在以横轴残差图中的点应该分布在以横轴 为中心的带形区域;为中心的带形区域; 对于远离横轴的点,要特别注意。对于远离横轴的点,要特别注意。 错误数据 模型问题 身 高 与 体 重 残 差 图 异 常 点 残差的作用残差的作用 1.1.通过残差表或残差图发现原始数据中的可疑数据通过残差表或残差图发现原始数据中的可疑数据 残差 -4000 -2000 0 2000 4000 6000 024681012 残差 通过残差通过残差 来判断模型拟合的效果这种来判断模型拟合的效果这种 分析工作称为分析工作称为残

10、差分析残差分析 1, 2, 3, . n e e ee 通过残差表或残差图判断模型拟合的效果是直观判通过残差表或残差图判断模型拟合的效果是直观判 断,如何精确判断模型拟合的效果?断,如何精确判断模型拟合的效果? 引入参数引入参数R R2 2 n 2 ii 2 i 1 n 2 i i 1 yy R1 yy $ n 2 i i 1 yy 来精确该画模型拟合效果来精确该画模型拟合效果 n 2 ii i 1 yy $ 对于己获取的样本数据对于己获取的样本数据,在上式子中在上式子中 是定是定 值值, 越小越小,即残差平方和越小即残差平方和越小,R R2 2越大越大,说说 明模型拟合效果越好明模型拟合效果

11、越好。 引入例中参数引入例中参数R R2 2计算得约为计算得约为0 0. .6464说明女大学生体重差说明女大学生体重差 异有百分之六十四是由身高引起的异有百分之六十四是由身高引起的. . 知识点知识点 线性回归分析线性回归分析 1 1. .对线性回归模型的三点说明对线性回归模型的三点说明 ( (1 1) )非确定性关系:线性回归模型非确定性关系:线性回归模型y=bx+a+ey=bx+a+e与确与确 定性函数定性函数y=bx+ay=bx+a相比相比,它表示它表示y y与与x x之间是统计相之间是统计相 关关系关关系( (非确定性关系非确定性关系),),其中的随机误差其中的随机误差e e提供了提

12、供了 选择模型的准则以及在模型合理的情况下探求最选择模型的准则以及在模型合理的情况下探求最 佳估计值佳估计值a a,b b的工具的工具. . (2)(2)线性回归方程线性回归方程 中中 , 的意义是:以的意义是:以 为基为基 数,数,x x每增加每增加1 1个单位,个单位,y y相应地平均增加相应地平均增加 个单位个单位. . (3)(3)线性回归模型中随机误差的主要来源线性回归模型中随机误差的主要来源 线性回归模型与真实情况引起的误差;线性回归模型与真实情况引起的误差; 观测与计算产生的误差;观测与计算产生的误差; 省略了一些因素的影响产生的误差省略了一些因素的影响产生的误差. . ybxa

13、 $ b $ a $a $ b $ 2.2.线性回归模型的模拟效果线性回归模型的模拟效果 (1)(1)残差图法残差图法: :观察残差图观察残差图, ,如果残差点比较均匀如果残差点比较均匀 地落在水平的带状区域中地落在水平的带状区域中, ,说明选用的模型比较说明选用的模型比较 合适合适, ,这样的带状区域的宽度越窄这样的带状区域的宽度越窄, ,说明模型拟合说明模型拟合 精度越高精度越高, ,回归方程的预报精度越高回归方程的预报精度越高. . ( (2 2) )残差的平方和法残差的平方和法: :一般情况下一般情况下, ,比较两个模型的残比较两个模型的残 差比较困难差比较困难( (某些样本点上一个模

14、型的残差的绝对值某些样本点上一个模型的残差的绝对值 比另一个模型的小比另一个模型的小, ,而另一些样本点的情况则相反而另一些样本点的情况则相反),), 故通过比较两个模型的残差的平方和的大小来判断模故通过比较两个模型的残差的平方和的大小来判断模 型的拟合效果型的拟合效果. .残差平方和越小的模型残差平方和越小的模型, ,拟合的效果越拟合的效果越 好好. . ( (3 3)R)R2 2法法: :R R2 2的值越大的值越大, ,说明残差平方和越小说明残差平方和越小, ,也就是说也就是说 模型拟合的效果越好模型拟合的效果越好. . 3 3. .相关系数与相关系数与R R2 2 ( (1 1)R)R

15、2 2是相关系数的平方是相关系数的平方, ,其变化范围为其变化范围为 0 0, ,1 1,而相而相 关系数的变化范围为关系数的变化范围为 - -1 1, ,1 1 . . ( (2 2) )相关系数可较好地反映变量的相关性及正相关或相关系数可较好地反映变量的相关性及正相关或 负相关负相关, ,而而R R2 2反映了回归模型拟合数据的效果反映了回归模型拟合数据的效果. . ( (3 3) )当当|r|r|接近于接近于1 1时说明两变量的相关性较强时说明两变量的相关性较强, ,当当|r|r| 接近于接近于0 0时说明两变量的相关性较弱时说明两变量的相关性较弱, ,而当而当R R2 2接近于接近于1

16、 1 时时, ,说明线性回归方程的拟合效果较好说明线性回归方程的拟合效果较好. . 【微思考微思考】 ( (1 1) )残差与我们平时说的误差是一回事儿吗残差与我们平时说的误差是一回事儿吗? ? 提示提示: :这两个概念在某程度上具有很大的相似性这两个概念在某程度上具有很大的相似性, ,都都 是衡量不确定性的指标是衡量不确定性的指标, ,二者的区别是二者的区别是: :误差与测量误差与测量 有关有关, ,误差可以衡量测量的准确性误差可以衡量测量的准确性, ,误差越大表示测误差越大表示测 量越不准确量越不准确; ;残差与预测有关残差与预测有关, ,残差大小可以衡量预残差大小可以衡量预 测的准确性测

17、的准确性, ,残差越大表示预测越不准确残差越大表示预测越不准确. . ( (2 2)R)R2 2与原来学过的相关系数与原来学过的相关系数r r有区别吗有区别吗? ? 提示提示: :它们都是刻画两个变量之间的的相关关系的它们都是刻画两个变量之间的的相关关系的, ,区区 别是别是R R2 2表示解释变量对预报变量变化的贡献率表示解释变量对预报变量变化的贡献率, ,其表其表 达式为达式为R R2 2= =1 1- - ; ; 相关系数相关系数r r是检验两个变量相关性的强弱程度是检验两个变量相关性的强弱程度, , 其表达式为其表达式为 n 2 ii i 1 n 2 i i 1 yy yy $ nn

18、iiii i 1i 1 nnnn 22 22 22 iiii i 1i 1i 1i 1 xx yyx ynx y r. xxyy(xnx )(yny ) 建立回归模型的基本步骤建立回归模型的基本步骤 ( (1 1) )确定研究对象确定研究对象,明确哪个变量是解释变量明确哪个变量是解释变量,哪个变量哪个变量 是预报变量是预报变量 ( (2 2) )画出确定好的解释变量和预报变量的散点图画出确定好的解释变量和预报变量的散点图,观察它观察它 们之间的关系们之间的关系( (如是否存在线性关系等如是否存在线性关系等) ) ( (3 3) )由经验确定回归方程的类型由经验确定回归方程的类型( (如我们观察

19、到数据呈线如我们观察到数据呈线 性关系性关系,则选用线性回归方程则选用线性回归方程) ) ( (4 4) )按一定规则按一定规则( (如最小二乘法如最小二乘法) )估计回归方程中的参数估计回归方程中的参数 ( (5 5) )得出结果后分析残差图是否有异常得出结果后分析残差图是否有异常( (如个别数据对应如个别数据对应 残差过大残差过大,或残差呈现不随机的规律性等或残差呈现不随机的规律性等) )若存在异若存在异 常常,则检查数据是否有误则检查数据是否有误,或模型是否合适等或模型是否合适等 为研究重量为研究重量x x( (单位:克单位:克) )对弹簧长度对弹簧长度y y( (单位:单位: 厘米厘米

20、) )的影响,对不同重量的的影响,对不同重量的6 6个物体进行测量,数个物体进行测量,数 据如下表所示:据如下表所示: x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.9 11.8 (1)(1)作出散点图并求线性回归方程;作出散点图并求线性回归方程; (2)(2)求出求出R R2 2; (3)(3)进行残差分析进行残差分析 作残差分析时,一般从以下几个方面予以说明:作残差分析时,一般从以下几个方面予以说明: (1)(1)散点图;散点图;(2)(2)相关指数;相关指数;(3)(3)残差图中的异常点残差图中的异常点 和样本点的带状分布区域的宽窄和样本点的带状

21、分布区域的宽窄 解答解答 (1)(1)散点图如图散点图如图 x 1 6(5 1015202530)17.5, y 1 6(7.25 8.128.959.9010.911.8)9.487, i 1 6 x2i2 275, i 1 6 xiyi1 076.2 0.05 0.005 0.08 0.045 0.04 0.025 2.24 1.37 0.54 0.41 1.41 2.31 计算得,计算得,b 0.183,a 6.285, 所求回归直线方程为所求回归直线方程为y 0.183x6.285. (2)列表如下:列表如下: yiy i yi y 所以所以 i 1 6 (yiy i)2 0.013

22、18, i 1 6 (yi y )2 14.678 4. 所以,所以,R210.013 18 14.678 4 0.999 1, 回归模型的拟合效果较好回归模型的拟合效果较好 ( (3 3) )由残差表中的数值可以看出第由残差表中的数值可以看出第3 3个样本点的残差比较个样本点的残差比较 大大,需要确认在采集这个数据的时候是否有人为的错需要确认在采集这个数据的时候是否有人为的错 误误,如果有的话如果有的话,需要纠正数据需要纠正数据,重新建立回归模型;重新建立回归模型; 由表中数据可以看出残差点比较均匀地落在不超过由表中数据可以看出残差点比较均匀地落在不超过0 0. .1515 的狭窄的水平带状

23、区域中的狭窄的水平带状区域中,说明选用的线性回归模型的说明选用的线性回归模型的 精度较高精度较高,由以上分析可知由以上分析可知,弹簧长度与拉力成线性关弹簧长度与拉力成线性关 系系 规律方法规律方法 当资料点较少时当资料点较少时,也可以利用残差表进行残也可以利用残差表进行残 差分析差分析,注意计算数据要认真细心注意计算数据要认真细心,残差分析要全面残差分析要全面 1.1.判一判判一判( (正确的打“正确的打“”, ,错误的打“错误的打“”)”) (1)(1)残差平方和越小残差平方和越小, ,线性回归方程拟合效果越好线性回归方程拟合效果越好.(.( ) ) (2)(2)在画两个变量的散点图时在画两

24、个变量的散点图时, ,预报变量在预报变量在x x轴上轴上, ,解释变解释变 量在量在y y轴上轴上. . ( ( ) ) (3)R(3)R2 2越接近于越接近于1,1,线性回归方程的拟合效果越好线性回归方程的拟合效果越好.(.( ) ) 2.2.做一做做一做( (请把正确的答案写在横线上请把正确的答案写在横线上) ) (1)(1)从散点图上看从散点图上看, ,点散布在从左下角到右上角的点散布在从左下角到右上角的 区域内区域内, ,两个变量的这种相关关系为两个变量的这种相关关系为 . . (2)(2)在残差分析中在残差分析中, ,残差图的纵坐标为残差图的纵坐标为 . . (3)(3)如果发现散点

25、图中所有的样本点都在一条直如果发现散点图中所有的样本点都在一条直 线上线上, ,则残差平方和等于则残差平方和等于 , ,解释变量和预报解释变量和预报 变量之间的相关系数变量之间的相关系数R R等于等于 . . 正相关正相关 残差残差 0 0 1 1或或- -1 1 3.已知某种商品的价格已知某种商品的价格x(元元)与需求量与需求量y(件件)之间的之间的 关系有如下一组数据:关系有如下一组数据: x 14 16 18 20 22 y 12 10 7 5 3 求求y对对x的回归直线方程,并说明回归模型拟合效果的回归直线方程,并说明回归模型拟合效果 的好坏的好坏 解解 x 1 5(14 161820

26、22)18, y 1 5(12 10753)7.4, i 1 5 x2i1421621822022221 660, i 1 5 xiyi14121610187205223620, 所以所以b i 1 5 xiyi5x y i 1 5 x2i5 x 2 620 5187.4 1 6605182 1.15. a 7.41.151828.1, 所以所求回归直线方程是:所以所求回归直线方程是:y 1.15x28.1. 列出残差表:列出残差表: 0 0.3 0.4 0.1 0.2 4.6 2.6 0.4 2.4 4.4 yiy i yi y 所以,所以, i 1 5 (yiy i)2 0.3, i 1 5 (yi y )2 53.2, R21 i 1 5 yiy i 2 i 1 5 yi y 2 0.994, 所以回归模型的拟合效果很好所以回归模型的拟合效果很好 线性相关系数的具体计算公式为: r n i1 (xix)(yiy) n i1 (xix) 2 n i1 (yiy) 2 . 当 r0 时,表明两个变量正相关;当 r0 时,表明两个变量负 相关;|r|越接近于 1,表明两个变量的线性相关性越强;|r|越 接近于 0, 表明两个变量之间几乎不存在线性相关关系 通常, 当 r 的绝对值大于 0.75 时,我们认为两个变量存在着很强的 线性相关关系 敬请指导敬请指导 .

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 数学 > 人教A版 >
版权提示 | 免责声明

1,本文(高中数学人教A版选修1-2课件:1.1《回归分析》课时1 .ppt)为本站会员(金钥匙文档)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|