ImageVerifierCode 换一换
格式:PPTX , 页数:41 ,大小:769.41KB ,
文档编号:1148224      下载积分:1 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-1148224.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(lilei2001)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(人教A版高中数学选修2-3 第三章3.1回归分析的基本思想及其初步应用 ppt课件(共41张PPT).pptx)为本站会员(lilei2001)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

人教A版高中数学选修2-3 第三章3.1回归分析的基本思想及其初步应用 ppt课件(共41张PPT).pptx

1、导入新课导入新课 在在数学数学3中,我们对两个具有线性相关中,我们对两个具有线性相关 关系的变量利用回归分析的方法进行了研究,关系的变量利用回归分析的方法进行了研究, 其步骤为其步骤为: 画散点图画散点图 求回归直线方程求回归直线方程 用直线方程进行预报用直线方程进行预报 函数关系是一种确定性关系函数关系是一种确定性关系, ,而相关关系是一而相关关系是一 种非确定性关系种非确定性关系. .那么那么, ,这节课我们就学习对具有这节课我们就学习对具有 相关关系的两个变量进行统计分析的一种常用方相关关系的两个变量进行统计分析的一种常用方 法法回归分析回归分析. . 提问:“名师出高徒”这句彦语的意提

2、问:“名师出高徒”这句彦语的意 思是什么?有名气的老师就一定能教出厉思是什么?有名气的老师就一定能教出厉 害的学生吗?这两者之间是否有关?害的学生吗?这两者之间是否有关? 1.1回归分析的基本思想回归分析的基本思想 及及 其初步应用其初步应用 通过典型案例的探究,进一步了解回通过典型案例的探究,进一步了解回 归分析的基本思想、方法及初步应用归分析的基本思想、方法及初步应用. 了解回归模型和函数模型的区别任了解回归模型和函数模型的区别任 何模型只能近似描述实际问题何模型只能近似描述实际问题 了解残差分析和指标了解残差分析和指标 的含义 的含义. 教学目标教学目标 知识目标知识目标 能力目标能力目

3、标 具有初步应用回归分析的能力具有初步应用回归分析的能力. 情感目标情感目标 通过对回归分析的基本思想的学习,能通过对回归分析的基本思想的学习,能 够在现实生活中应用此思想够在现实生活中应用此思想. 教学重难点教学重难点 (1)了解线性回归模型与函数模型的差异)了解线性回归模型与函数模型的差异; (2)了解判断刻画模型拟合效果的方法)了解判断刻画模型拟合效果的方法 相关指数和残差分析相关指数和残差分析. 解释残差变量的含义,了解偏差平解释残差变量的含义,了解偏差平 方和分解的思想方和分解的思想. 探究探究 对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据 (x1,y1),(x2,y

4、2),(xn,yn), 我们知道回归直线我们知道回归直线y=bx+a的斜率和截距的最的斜率和截距的最 小二乘估计分别为小二乘估计分别为 n ii i=1 n 2 i i=1 (x - x)(y -y) b =, (x - x) a = y -bx, 其中其中 nn ii i=1i=1 11 x =x ,y =y ,(x,y) nn 称为称为样本点的中心样本点的中心,你能推导出这两个,你能推导出这两个 计算公式吗?计算公式吗? 回归直线过回归直线过 样本点的中心样本点的中心 从已经学过的知识我们知道,斜距从已经学过的知识我们知道,斜距 和斜率和斜率 分别是使分别是使 a b iiii Q(,)=

5、 y -y = y -(x +) 取最小时取最小时 的值的值.由于由于 , n 2 ii i=1 Q(,) =y -x -(y-x)+(y-x)- n 2 iiii i=1 2 y -x -(y-x) +2y -x -(y-x) (y-x)-+(y-x)- n ii i=1 n ii i=1 y -x -(y-x)(y-x-) = (y-x-)y -x -(y-x) 注注意意到到 nn ii i=1i=1 = (y-x-)y -x -n(y-x) = (y-x-)ny-nx-n(y-x)= 0, nn 2 iiii i=1i=1 2 =y -x -(y-x) +2y -x -(y-x)(y-x

6、-) +n(y-x-) , 继续继续 n 22 ii i=1 Q(,) =y -x -(y-x) +n(y-x-),因因此此 22 nnn 22 iiii i=1i=1i=1 =(x -x) -2(x -x)(y -y)+(y -y) +n(y-x-) 2 nn 2 2 iiiin 2 i=1i=1 i nn 22 i=1 ii i=1i=1 2 n i i=1 (x -x)(y -y)(x -x)(y -y) =n(y-x-) +(x -x)- (x -x)(x -x) +(y -y) 继续继续 在上式中,后两项和在上式中,后两项和 无关,而前两无关,而前两 项为非负数,因此要使项为非负数,

7、因此要使Q取得最小值,当且仅取得最小值,当且仅 当前两项的值均为当前两项的值均为0,即有,即有 n ii i=1 n 2 i i=1 (x -x)(y -y) = (x -x) 这正是我们所要推导的公式这正是我们所要推导的公式. , 从某大学中随机选取从某大学中随机选取8名女大学生,其身名女大学生,其身 高和体重数据如下表所示:高和体重数据如下表所示: 例题例题1 编编 号号 1 2 3 4 5 6 7 8 身高身高/cm 165 165 157 170 175 165 155 170 体重体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重求根据一

8、名女大学生的身高预报她的体重 的回归方程,并预报一名身高为的回归方程,并预报一名身高为172cm的女大的女大 学生的体重学生的体重. 解答解答 第一步第一步:画散点图画散点图 0 20 40 60 80 150155160165170175180 身高/cm 体重/kg 第二步:求回归方程第二步:求回归方程 第三步第三步:代值计算代值计算 探究探究 身高为身高为 172c的女大的女大 学生的体重一学生的体重一 定是定是60.316kg 吗?如果不是吗?如果不是, 其原因是什么其原因是什么? 计算器得:计算器得: 故线性回归方程:故线性回归方程: 当当x=172时,时, 0.849.b -85.

9、712,a 85.712.-0.849xy y 0.849 172-85.712 60.316(kg) 0 20 40 60 80 150155160165170175180 身高/cm 体重/kg 显然,身高显然,身高172cm的女大学生的体重不一的女大学生的体重不一 定是定是60.316kg,但一般可以认为她的体重在,但一般可以认为她的体重在 60.316kg左右,下图中的样本点和回归直线的左右,下图中的样本点和回归直线的 相互位置说明了这一点相互位置说明了这一点. 由于所有的样本点不共线由于所有的样本点不共线,而只是散布而只是散布 在某一条直线的附近在某一条直线的附近,所以身高和体重的关

10、所以身高和体重的关 系可用线性回归模型系可用线性回归模型 y=bx+a+e 来表示来表示,这里这里a和和b为模型的未知参数为模型的未知参数,e 是是y与与bx+a之间的误差之间的误差.通常通常e为随机变量为随机变量, 称 为 随 机 误 差称 为 随 机 误 差 . 它 的 均 值它 的 均 值 E(e)=0 , 方 差方 差 D(e)= 20,这样线性回归的完整表达式为这样线性回归的完整表达式为 y=bx+a+e E(e)=0, D(e)= 2. 注意注意 存在误差的原因存在误差的原因 (1)随机误差,其大小取决于随机误差的方)随机误差,其大小取决于随机误差的方 差差. 在线性回归模型中,随

11、机误差在线性回归模型中,随机误差e的方差的方差 2越越 小小 ,用,用bx+a预报真实值预报真实值y的精度越高的精度越高. (2) 和和 为斜率和截距的估计值,它们与为斜率和截距的估计值,它们与 真实值真实值a和和b之间也存在误差之间也存在误差. b a 要牢记!要牢记! 探究探究 在线性回归模型中,在线性回归模型中,e是用是用bx+a预报真实值预报真实值y 的随机误差,它是一个不可观测的量,那么应该的随机误差,它是一个不可观测的量,那么应该 怎样研究随机误差呢?怎样研究随机误差呢? 在实际应用中,我们用回归方程在实际应用中,我们用回归方程 a xb y 中的中的 估计估计bx+a. 由于随机

12、误差由于随机误差e=y-(bx+a), 所以所以 是是e的估计值的估计值. 对于样本点对于样本点 (x1,y1),(x2,y2),(xn,yn) y y -ye 而言,它们的随机误差为而言,它们的随机误差为 ei=yi-bxi-a,i=1,2,n, 其估计值为其估计值为 n,1,2,.,2,.,i,i a xb y y y e iiii i e 称为相应于点称为相应于点(xi,yi)的的残差残差(residual). 要牢记!要牢记! 思考思考 如何发现数据中的错误?如何衡量模型如何发现数据中的错误?如何衡量模型 的拟合效果?的拟合效果? (1)可以利用残差图来分析残差特性;)可以利用残差图来

13、分析残差特性; (2)可以利用)可以利用. nn 22 iii 2i=1i=1 nn 22 ii i=1i=1 (y -y )(y -y) R= 1-= (y -y)(y -y) 来刻画回归的效果来刻画回归的效果. 何为残差图?何为残差图? 残差图残差图 作图时纵作图时纵 坐标为残差,坐标为残差, 横坐标可以选横坐标可以选 为样本编号,为样本编号, 或身高数据,或身高数据, 或体重的估计或体重的估计 值等,这样作值等,这样作 出的图形称为出的图形称为 残差图残差图. 0 编号编号 1 2 3 4 5 6 7 10 20 30 40 50 60 70 80 -10 -20 -30 -40 -50

14、 -60 90 100 要牢记!要牢记! 对对R R2 2的理解的理解 (1)在含有一个解释变量的线性模型中,)在含有一个解释变量的线性模型中, R2恰恰 好等于相关系数好等于相关系数r的平方的平方. (2)对于已经获取的样本数据,)对于已经获取的样本数据, R2表达式中的表达式中的 为确定的数为确定的数. 因此因此R2越大,意味着残差平方和越大,意味着残差平方和 越小,即模型的拟合效果越好;反之,越差越小,即模型的拟合效果越好;反之,越差. n 1i 2 i )y-(y n 1i 2 i )y-(y 要牢记!要牢记! 用身高预报体重时,需要注意以下问题用身高预报体重时,需要注意以下问题 (1

15、)回归方程只适用于我们所研究的样本)回归方程只适用于我们所研究的样本 总体;总体; (2)我们所建立的回归方程一般都有时间)我们所建立的回归方程一般都有时间 性;性; (3)样本取值的范围会影响回归方程的适)样本取值的范围会影响回归方程的适 用范围;用范围; (4)不能期望回归方程得到的预报值就是)不能期望回归方程得到的预报值就是 预报变量的精确值预报变量的精确值. 建立回归模型的基本步骤建立回归模型的基本步骤: : (1)确定研究对象,明确哪个变量是解释变确定研究对象,明确哪个变量是解释变 量,哪个变量是预报变量;量,哪个变量是预报变量; (2)画出解释变量和预报变量的散点图,观画出解释变量

16、和预报变量的散点图,观 察它们之间的关系;察它们之间的关系; (3)由经验确定回归方程的类型;由经验确定回归方程的类型; (4)按一定规则估计回归方程中的参数;按一定规则估计回归方程中的参数; (5)得出结果后分析残差图是否有异常,若得出结果后分析残差图是否有异常,若 有异常,检查数据是否有误,或模型是否合适等有异常,检查数据是否有误,或模型是否合适等. . 要牢记!要牢记! 为了对为了对x、Y两个变量进行统计分析,现两个变量进行统计分析,现 有以下两种线性模型有以下两种线性模型 和和 试比较哪一个模型拟合的效果更好试比较哪一个模型拟合的效果更好. 例题例题2 关于关于X X与与Y Y有如下数

17、据有如下数据: : x 2 4 5 6 8 y 30 40 60 50 70 y = 6.5x+17.5 y = 7x +17 分析:既可分别求出两种模型下的总偏差分析:既可分别求出两种模型下的总偏差 平方和、残差平方和、回归平方和,也可分别平方和、残差平方和、回归平方和,也可分别 求出两种模型下的相关指数,然后再进行比较,求出两种模型下的相关指数,然后再进行比较, 从而得出结论从而得出结论. 5 2 ii 2 i=1 15 2 i i=1 (y -y ) 155 R =1-=1-= 0.845 1000 (y -y) 2 2 R =1- 5 2 ii i=1 5 2 i i=1 (y -y

18、) 180 =1-= 0.82 1000 (y -y) , 84.5%82%,所以甲选用的模型拟合效果较好,所以甲选用的模型拟合效果较好. 解答解答 课堂小结课堂小结 1.数学知识数学知识 (1)建立回归模型及残差图分析的基本步骤;)建立回归模型及残差图分析的基本步骤; (2)不同模型拟合效果的比较方法;)不同模型拟合效果的比较方法; (3)相关指数和残差的分析)相关指数和残差的分析. 2. 数学思想数学思想 数形结合的思想,化归思想及整体思想数形结合的思想,化归思想及整体思想. 3.数学方法数学方法 数形结合法,转化法,换元法数形结合法,转化法,换元法. 针对性练习针对性练习 1. 某校有学

19、生某校有学生2000人,其中高三学生人,其中高三学生500人,人, 为了了解学生身体素质情况,采用按年级分层抽为了了解学生身体素质情况,采用按年级分层抽 样的方法,从该学生中抽取一个样的方法,从该学生中抽取一个200人的样本,人的样本, 则样本中高三学生的人数为则样本中高三学生的人数为_. 解析:本题考查抽样的方法解析:本题考查抽样的方法. 由已知抽样比由已知抽样比 200/2000=1/10,故样本中高三学生数为,故样本中高三学生数为500* (1/10)=50. 2.下表提供了某厂节能降耗技术改造后生产甲下表提供了某厂节能降耗技术改造后生产甲 产品过程中记录的产量产品过程中记录的产量x(吨

20、)与相应的生产能耗(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据(吨标准煤)的几组对照数据. x 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图;)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法)请根据上表提供的数据,用最小二乘法 求出求出y关于关于x的线性回归方程的线性回归方程 y = bx+a . (3)已知该厂技改前)已知该厂技改前100吨甲产品的生产能吨甲产品的生产能 耗为耗为90吨标准煤试根据(吨标准煤试根据(2)求出的线性回归)求出的线性回归 方程,预测生产方程,预测生产100吨甲产品的生产能耗比技改吨甲产品的生产能耗比技改 前降

21、低多少吨标准煤?前降低多少吨标准煤? 解析:解析: (1)如下图如下图 0 1 2 3 4 5 6 7 012345 产量 能耗 66.54.5645342.53(2) y x i n 1i i 4.5 4 6543 x 3.5 4 4.5432.5 y 866543 i 2222 n 1i 2 x 2 66.5-4 4.5 3.566.5-63 b = 0.7 86-4 4.586-81 a=Y-bX=3.5-0.7 4.5=0.35 故线性回归方程为故线性回归方程为y=0.7x+0.35. (3)根据回归方程的预测,现在生产根据回归方程的预测,现在生产100吨产品吨产品 消耗的标准煤的数量

22、为消耗的标准煤的数量为0.7100+0.35=70.35. 1.选择选择 课堂练习课堂练习 (1)下列说法中正确的有)下列说法中正确的有:( ) 若若r0,则,则x增大时,增大时,y也相应增大也相应增大; 若若r0,表示两个相关变量正相关,表示两个相关变量正相关,x增大增大 时,时,y也相应增大,故也相应增大,故正确正确. r0,表示两个变,表示两个变 量负相关,量负相关,x增大时,增大时,y也相应减小,故也相应减小,故错误错误. |r|越接近越接近1,表示两个变量相关性越高,表示两个变量相关性越高,|r|=1表表 示两个变量有确定的关系(即函数关系),故示两个变量有确定的关系(即函数关系),

23、故 正确正确. (2)对两个变量)对两个变量y与与x进行回归分析,分别选进行回归分析,分别选 择不同的模型,它们的相关系数择不同的模型,它们的相关系数r如下,其中拟合如下,其中拟合 效果最好的模型是(效果最好的模型是( ) A.模型模型的相关系数的相关系数r为为0.98 B.模型模型的相关系数的相关系数r为为0.80 C.模型模型的相关系数的相关系数r为为0.50 D.模型模型的相关系数的相关系数r为为0.25 解析解析:根据相关系数的定义和计算公式可知,根据相关系数的定义和计算公式可知, |r|1,且,且|r|越接近于越接近于1,相关程度越大,拟合效果,相关程度越大,拟合效果 越好;越好;|

24、r|越接近于越接近于0,相关程度越小,拟合效果越弱,相关程度越小,拟合效果越弱. A (3)对有线性相关关系的两个变量建立的回)对有线性相关关系的两个变量建立的回 归直线方程归直线方程 中,回归系数中,回归系数 ( ) A.可以小于可以小于0 B.小于小于0 C.能等于能等于0 D.只能等于只能等于0 axby b 解析解析: 时,得时,得r=0,这时不具有线性,这时不具有线性 相关性,但相关性,但 能大于能大于0,也能小于,也能小于0. b0 b A 2.解答题解答题 (1)现随机抽取了我校)现随机抽取了我校10名学生在入学考名学生在入学考 试中的数学成绩(试中的数学成绩(x)与入学后的第一

25、次考试中)与入学后的第一次考试中 的数学成绩(的数学成绩(y),数据如下:),数据如下: 学生号学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 试问这试问这10个学生的两次数学考试成绩是否具个学生的两次数学考试成绩是否具 有显著性线性相关关系?有显著性线性相关关系? 查表得自由度为查表得自由度为10-2=8相应的相关关系临相应的相关关系临 界值界值 由由 知,两次数学考试成绩知,两次数学考试成绩 有显著性的线性相关关系有显著性的线性相关关系. 10

26、 1i 2 i 116584x 10 1i 2 i 47384y107.8x 68y 73796yx 10 1i ii 易得易得 则相关系数为则相关系数为 解答解答 22 73796 10 107.8 68 r0.7506 (116584 10 107.8 )(47384 10 68 ) 0.05 r0.6021 0.05 rr (2)观察两相关量得如下数据)观察两相关量得如下数据: x -1 -2 -3 -4 -5 5 3 4 2 1 y -9 -7 -5 -3 -1 1 5 3 7 9 求两变量间的回归方程求两变量间的回归方程. i 1 2 3 4 5 6 7 8 9 10 xi -1 -2 -3 -4 -5 5 3 4 2 1 yi -9 -7 -5 -3 -1 1 5 3 7 9 xiyi 9 14 15 12 5 5 15 12 14 9 解答解答 列表列表: 101010 2 2 ii ii i=1i=1i=1 x = 0,y = 0, =110,= 330,=110.yy xx 10 i i i=1 10 22 i i=1 -10 xy 110-10 0 b =1 110-10 0 -10 y x xx a = y-bx =0-b 0=0 y = x. 所求回归直线方程为所求回归直线方程为

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|