1、第三章统计案例3 3.1 1回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用1.了解回归分析的基本思想,会对两个变量进行回归分析,会求两个具有线性相关关系的变量的回归直线方程,并用回归直线方程进行预报.2.了解最小二乘法的思想方法,理解回归方程与一般函数的区别与联系.3.通过典型案例的分析,了解回归分析的初步应用相关检验.12341234知识拓展知识拓展1.当r0时,表明两个变量正相关;当r|r甲|=0.8更接近于1,乙组数据相关性强.答案:B12342.随机误差(1)随机误差的均值E(e)=0,方差D(e)=2.(2)线性回归模型的完整表达式是 在此线性回归模型中,随机误差e的方
2、差2越小,通过回归直线预报真实值y的精度越高.知识拓展知识拓展随机误差的主要来源:(1)用线性回归模型近似地逼近真实模型所引起的误差;(2)忽略了某些因素的影响所产生的误差;(3)观测误差.12341234知识拓展知识拓展在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率.R2越接近于1,表示回归的效果越好(因为R2越接近于1,表示解释变量和预报变量的相关性越强).如果对某组数据可以采取几种不同的回归方程进行回归分析,也可以通过比较几个R2,选择其值大的模型.1234【做一做2】有下列说法:在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;R2用来刻画回归效果,
3、R2值越大,说明模型拟合效果越好;比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是()A.0B.1C.2D.3答案:D12343.非线性回归方程当回归方程不是形如y=bx+a(a,bR)时,称之为非线性回归方程.非线性回归方程也可以线性化.(1)将幂函数型函数y=axn(a为常数,a,x,y均取正值)化为线性函数:将y=axn两边取常用对数,则有lg y=nlg x+lg a,令=lg y,v=lg x,b=lg a代入上式得=nv+b(其中n,b是常数),其图象是一条直线.(2)将指数型函数y=cax(a0,c0,a,c为常数)化为线
4、性函数:将y=cax两边取常用对数,则有lg y=xlg a+lg c,令=lg y,b=lg c,d=lg a,代入上式得=dx+b(d,b是常数),它的图象是一条直线.12344.建立回归模型的基本步骤一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型.(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.121.相关分析的意义和作用是什
5、么剖析函数是大家比较熟悉的概念,它是指变量之间的确定性关系,即当X取某一数值x时,变量Y按照某种规则总有一个确定的数值与之对应.相关关系则是指变量之间的非确定性关系,由于随机因素的干扰,当变量X取确定值x时,变量Y的取值不确定,是一个随机变量,但它的概率分布与X的取值有关.这里,我们看到了函数关系与相关关系的本质区别,在函数关系中变量X对应的是变量Y的确定值,而在相关关系中,变量X对应的是变量Y的概率分布.换句话说,相关关系是随机变量之间或随机变量与非随机变量之间的一种数量依存关系,对于这种关系,只能运用统计方法进行研究.通过对相关关系的研究又可以总结规律,从而指导人们的生活与生产实践.仅供学
6、习交流!仅供学习交流!122.举例说明怎样确定线性回归的模型剖析在确定数据适合哪种模型之前,首先应该对观测数据绘图,以便进行简单的观测.例如,为了研究建立初始工资与当前工资的回归模型,首先对观测数据绘图,如下图所示.12从图中可以发现初始工资与当前工资的趋势大概呈线性关系,可以建立线性回归方程.如果观测数据不呈线性分布,那么还可以根据其他方程模型的观测数据分布图形的特点以及对建立各方程后所得的R2进行比较以便确定一种最佳方程式.一般说来,如果所有的观测量都落到回归直线上,那么R2等于1;如果自变量与因变量之间没有回归关系,那么R2等于0.另外,我们通过对观测数据分布图形的仔细观察还可以发现一些
7、奇异值,所以还可以通过对数据的检查来消除奇异值.但是,对待奇异值时要格外小心.题型一题型二题型三题型四【例1】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下:(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求回归直线方程;(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?题型一题型二题型三题型四题型一题型二题型三题型四题型一题型二题型三题型四题型一题型二题型三题型四【变式训练1】某工厂18月份某种产品的产量x(单位:t)与成本y(单位:万元)的统计数据如下表:(1)画出散点图;(2)判断y与x是否具有线性相关关
8、系,若有,求出其线性回归方程.题型一题型二题型三题型四解:(1)散点图如图.(2)由图可看出,这些点基本分布在一条直线附近,可以认为x和y线性相关.题型一题型二题型三题型四【例2】某运动员训练次数与成绩之间的数据关系如下:(1)作出散点图;(2)求出回归方程;(3)作出残差图;(4)计算R2;(5)试预测该运动员训练47次及55次的成绩.题型一题型二题型三题型四解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图,由散点图可知,它们之间具有线性相关关系.题型一题型二题型三题型四题型一题型二题型三题型四(3)残差分析.作残差图如图,由图可知,残差点比较均匀地分布在水平带状区域中,说
9、明选用的模型比较合适.(4)计算R2.计算得R20.985 5.说明了该运动员的成绩的差异有98.55%是由训练次数引起的.题型一题型二题型三题型四(5)作出预报.由上述分析可知,我们可用回归方程 =1.041 48x-0.003 09作为该运动员成绩的预报值.将x=47和x=55分别代入该方程可得y49和y57.故预测该运动员训练47次和55次的成绩分别为49和57.反思反思“R2、残差图”在回归分析中的作用:(1)R2是用来刻画回归效果的,由 可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域
10、中,带状区域的宽度越窄,说明模型拟合精度越高,回归方程预报精度越高.题型一题型二题型三题型四【变式训练2】某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽数为多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程题型一题型二题型三题型四题型一题型
11、二题型三题型四题型一题型二题型三题型四题型一题型二题型三题型四可以求得:r0.998.由于|r|0.9980.75,可知u和v具有很强的线性相关性.再求出b-0.146,a0.548.题型一题型二题型三题型四【变式训练3】在一化学反应过程中,某化学物质的反应速率y(单位:g/min)与一种催化剂的量x(单位:g)有关,现收集了如下表所示的8组数据,试建立y与x之间的回归方程.题型一题型二题型三题型四解:根据收集的数据作散点图,如图.根据样本点的分布情况,可选用两种曲线模型来拟合.可认为样本点集中在某二次曲线y=c1x2+c2的附近.令t=x2,则变换后样本点应该分布在直线y=bt+a(b=c1
12、,a=c2)的周围.题型一题型二题型三题型四由题意得变换后t与y的样本数据如下表:y与t的散点图如图.由y与t的散点图可以观察到样本数据点并不分布在一条直线的周围,因此不宜用线性回归方程y=bt+a来拟合,即不宜用二次曲线y=c1x2+c2来拟合y与x之间的关系.题型一题型二题型三题型四题型一题型二题型三题型四z与x的散点图如图.因为根据散点图可以观察到样本数据点大致分布在一条直线的周围,所以可以用线性回归方程来拟合.题型一题型二题型三题型四仅做学习交流,谢谢!仅做学习交流,谢谢!语文:初一新生使用的是教育部编写的教材,也称“部编”教材。“部编本”是指由教育部直接组织编写的教材。“部编本”除了
13、语文,还有德育和历史。现有的语文教材,小学有12种版本,初中有8种版本。这些版本现在也都做了修订,和“部编本”一同投入使用。“部编本”取代原来人教版,覆盖面比较广,小学约占50%,初中约占60%。今秋,小学一年级新生使用的是语文出版社的修订版教材,还是先学拼音,后学识字。政治:小学一年级学生使用的教材有两个版本,小学一年级和初一的政治教材不再叫思想品德,改名为道德与法治。历史:初一新生使用华师大版教材。历史教材最大的变化是不再按科技、思想、文化等专题进行内容设置,而是以时间为主线,按照历史发展的时间顺序进行设置。关于部编版,你知道多少?为什么要改版?跟小编一起来了解下吧!一新教材的五个变化一、
14、入学以后先学一部分常用字,再开始学拼音。汉字是生活中经常碰到的,但拼音作为一个符号,在孩子们的生活中接触、使用都很少,教学顺序换一换,其实是更关注孩子们的需求了。先学一部分常用常见字,就是把孩子的生活、经历融入到学习中。二、第一册识字量减少,由400字减少到300字。第一单元先学40个常用字,比如“地”字,对孩子来说并不陌生,在童话书、绘本里可以看到,电视新闻里也有。而在以前,课文选用的一些结构简单的独体字,比如“叉”字,结构比较简单,但日常生活中用得不算多。新教材中,增大了常用常见字的比重,减少了一些和孩子生活联系不太紧密的汉字。三、新增“快乐阅读吧”栏目,引导学生开展课外阅读。教材第一单元
15、的入学教育中,有一幅图是孩子们一起讨论西游记等故事,看得出来,语文学习越来越重视孩子的阅读表达,通过读故事、演故事、看故事等,提升阅读能力。入学教育中第一次提出阅读教育,把阅读习惯提升到和识字、写字同等重要的地位。四、新增“和大人一起读”栏目,激发学生的阅读兴趣,拓展课外阅读。有家长担心会不会增加家长负担,其实这个“大人”包含很多意思,可以是老师、爸妈、爷爷、奶奶、外公、外婆等,也可以是邻居家的小姐姐等。每个人讲述一个故事,表达是不一样的,有人比较精炼,有人比较口语化,儿童听到的故事不同,就会形成不同的语文素养。五、语文园地里,新增一个“书写提示”的栏目。写字是有规律的,一部分字有自己的写法,
16、笔顺都有自己的规则,新教材要求写字的时候,就要了解一些字的写法。现在信息技术发展很快,孩子并不是只会打字就可以,写字也不能弱化。二为什么要先识字后学拼音?一位语文教研员说,孩子学语文是母语教育,他们在生活中已经认了很多字了,一年级的识字课可以和他们之前的生活有机结合起来。原先先拼音后识字,很多孩子觉得枯燥,学的时候感受不到拼音的用处。如果先接触汉字,小朋友在学拼音的过程中会觉得拼音是有用的,学好拼音是为了认识更多的汉字。还有一位小学语文老师说:“我刚刚教完一年级语文,先学拼音再识字,刚进校门的孩子上来就学,压力会比较大,很多孩子有挫败感,家长甚至很焦急。现在让一年级的孩子们先认简单的字,可以让
17、刚入学的孩子们感受到学习的快乐,消除他们害怕甚至恐惧心理。我看了一下网上的新教材,字都比较简单,很多小朋友都认识。”语文:初一新生使用的是教育部编写的教材,也称“部编”教材。“部编本”是指由教育部直接组织编写的教材。“部编本”除了语文,还有德育和历史。现有的语文教材,小学有12种版本,初中有8种版本。这些版本现在也都做了修订,和“部编本”一同投入使用。“部编本”取代原来人教版,覆盖面比较广,小学约占50%,初中约占60%。今秋,小学一年级新生使用的是语文出版社的修订版教材,还是先学拼音,后学识字。政治:小学一年级学生使用的教材有两个版本,小学一年级和初一的政治教材不再叫思想品德,改名为道德与法
18、治。历史:初一新生使用华师大版教材。历史教材最大的变化是不再按科技、思想、文化等专题进行内容设置,而是以时间为主线,按照历史发展的时间顺序进行设置。关于部编版,你知道多少?为什么要改版?跟小编一起来了解下吧!一新教材的五个变化一、入学以后先学一部分常用字,再开始学拼音。汉字是生活中经常碰到的,但拼音作为一个符号,在孩子们的生活中接触、使用都很少,教学顺序换一换,其实是更关注孩子们的需求了。先学一部分常用常见字,就是把孩子的生活、经历融入到学习中。二、第一册识字量减少,由400字减少到300字。第一单元先学40个常用字,比如“地”字,对孩子来说并不陌生,在童话书、绘本里可以看到,电视新闻里也有。
19、而在以前,课文选用的一些结构简单的独体字,比如“叉”字,结构比较简单,但日常生活中用得不算多。新教材中,增大了常用常见字的比重,减少了一些和孩子生活联系不太紧密的汉字。三、新增“快乐阅读吧”栏目,引导学生开展课外阅读。教材第一单元的入学教育中,有一幅图是孩子们一起讨论西游记等故事,看得出来,语文学习越来越重视孩子的阅读表达,通过读故事、演故事、看故事等,提升阅读能力。入学教育中第一次提出阅读教育,把阅读习惯提升到和识字、写字同等重要的地位。四、新增“和大人一起读”栏目,激发学生的阅读兴趣,拓展课外阅读。有家长担心会不会增加家长负担,其实这个“大人”包含很多意思,可以是老师、爸妈、爷爷、奶奶、外
20、公、外婆等,也可以是邻居家的小姐姐等。每个人讲述一个故事,表达是不一样的,有人比较精炼,有人比较口语化,儿童听到的故事不同,就会形成不同的语文素养。五、语文园地里,新增一个“书写提示”的栏目。写字是有规律的,一部分字有自己的写法,笔顺都有自己的规则,新教材要求写字的时候,就要了解一些字的写法。现在信息技术发展很快,孩子并不是只会打字就可以,写字也不能弱化。二为什么要先识字后学拼音?一位语文教研员说,孩子学语文是母语教育,他们在生活中已经认了很多字了,一年级的识字课可以和他们之前的生活有机结合起来。原先先拼音后识字,很多孩子觉得枯燥,学的时候感受不到拼音的用处。如果先接触汉字,小朋友在学拼音的过程中会觉得拼音是有用的,学好拼音是为了认识更多的汉字。还有一位小学语文老师说:“我刚刚教完一年级语文,先学拼音再识字,刚进校门的孩子上来就学,压力会比较大,很多孩子有挫败感,家长甚至很焦急。现在让一年级的孩子们先认简单的字,可以让刚入学的孩子们感受到学习的快乐,消除他们害怕甚至恐惧心理。我看了一下网上的新教材,字都比较简单,很多小朋友都认识。”题型一题型二题型三题型四错解:B错因分析对残差平方和和R2理解错误.正解:R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.答案:C反思反思把握好R2的回归意义.
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。