1、1.1.1 回归分析课件 基础知识是形成学科能力的源头。本栏目根据课标要求,基础知识是形成学科能力的源头。本栏目根据课标要求,精准梳理,清晰呈现主要知识及内在关系。关键处合理挖空、精准梳理,清晰呈现主要知识及内在关系。关键处合理挖空、易错处及时提醒,多策并举,夯实基础。请以此为载体,安排易错处及时提醒,多策并举,夯实基础。请以此为载体,安排学生课前预习,以便打造高效课堂!学生课前预习,以便打造高效课堂!1.1.掌握线性回归方程的求解方法掌握线性回归方程的求解方法.2.2.会利用相关系数来判断变量之间的相关程度会利用相关系数来判断变量之间的相关程度.3.3.了解非线性模型通过变换转化为线性回归模
2、型的方法了解非线性模型通过变换转化为线性回归模型的方法.1.1.本课重点是线性回归方程的求解和相关系数的求解以及相关本课重点是线性回归方程的求解和相关系数的求解以及相关性判断性判断.2.2.本课难点是非线性回归模型与线性回归模型的转换本课难点是非线性回归模型与线性回归模型的转换.1.1.回归分析回归分析(1)(1)相关关系的特点:非确定关系,即因变量的取值不是随自相关关系的特点:非确定关系,即因变量的取值不是随自变量的取值而确定的,因变量的取值有变量的取值而确定的,因变量的取值有_;随机性随机性(2)(2)线性回归方程线性回归方程原理原理一般地,设有一般地,设有n n个收集数据如下:个收集数据
3、如下:当当a,ba,b能够满足使得能够满足使得Q=(yQ=(y1 1-bx-bx1 1-a)-a)2 2+(y+(y2 2-bx-bx2 2-a)-a)2 2+(y+(yn n-bx-bxn n-a)a)2 2取得最小值时取得最小值时,就称就称y=bx+ay=bx+a为拟合这为拟合这n n对数据的线性回归方对数据的线性回归方程程,该方程所表示的直线称为该方程所表示的直线称为_直线直线.x xx x1 1x x2 2x x3 3x xn ny yy y1 1y y2 2y y3 3y yn n回归回归公式公式y=bx+ay=bx+a,其中,其中niii 1n22ii 1x ynxyb,xnxa_
4、.ybx2.2.相关系数的计算相关系数的计算公公式式性性质质(1)(1)范围:范围:|r|1|r|1;(2)|r|(2)|r|越接近越接近_,x,yx,y的线性相关的线性相关程度越高;程度越高;(3)|r|(3)|r|越接近越接近0 0,x,yx,y的线性相关程度越的线性相关程度越_._.niii 1nn22iii 1i 1niii 1nn2222iii 1i 1xxyyrxxyyx ynx y.xnxyny1 1低低3.3.正相关、负相关与线性不相关正相关、负相关与线性不相关(1)(1)正相关:当正相关:当r r0 0时,时,lxyxy0,0,从而从而b=b=0,0,两个变量的值总两个变量的
5、值总体上呈现出体上呈现出_增减的趋势,此时称两个变量正相关增减的趋势,此时称两个变量正相关.(2)(2)负相关:当负相关:当r r0 0时,时,b b0,0,一个变量一个变量_,另一个变量有,另一个变量有_的趋势,称两个变量有负相关的趋势,称两个变量有负相关.(3)(3)线性不相关:当线性不相关:当_时,称两个变量线性不相关时,称两个变量线性不相关.xyxxll同时同时增加增加减少减少r=0r=04.4.可线性化的回归分析可线性化的回归分析常见的变形形式常见的变形形式类型类型变形方法变形方法幂函数曲线幂函数曲线y=axy=axb b 两边取对数变形为两边取对数变形为 lny=lna+blnxl
6、ny=lna+blnx,令令 y y=lny,x=lny,x=lnx,a=lnx,a=lna=lna ,从而得,从而得到到y y=a=a+bx+bx 指数曲线指数曲线 y=aey=aebxbx 两边取对数变形为两边取对数变形为 lny=lna+bxlny=lna+bx ,令,令y y=lny,a=lny,a=lna=lna ,从而得到,从而得到y y=a=a+bx+bx 类型类型变形方法变形方法倒指数曲线倒指数曲线两边取对数变形为两边取对数变形为 ,令,令 得得y y=a=a+bx+bx 对数曲线对数曲线y=y=a+blnx a+blnx 令令x x=lnx=lnx ,得,得y=a+bxy=a
7、+bx bxyaeblnylnax1ylny,x,alnax 1.1.相关关系与函数关系有怎样的区别?相关关系与函数关系有怎样的区别?提示:提示:相关关系是不确定关系,而函数关系是确定关系相关关系是不确定关系,而函数关系是确定关系.2.2.求线性回归方程前必须进行相关性检验吗?求线性回归方程前必须进行相关性检验吗?提示:提示:是的,必须检验两个变量是否具有线性相关关系,具有是的,必须检验两个变量是否具有线性相关关系,具有线性相关关系,求出的线性回归方程才有意义线性相关关系,求出的线性回归方程才有意义.3.3.利用线性回归方程求出的值是估计值还是准确值?利用线性回归方程求出的值是估计值还是准确值
8、?提示:提示:利用线性回归方程求出的值是估计值利用线性回归方程求出的值是估计值.4.4.以下给出的两个变量间是相关关系的有以下给出的两个变量间是相关关系的有_._.肥胖与血压;肥胖与血压;立方体的棱长与体积;立方体的棱长与体积;球的半径与表面积;球的半径与表面积;性别与性格;性别与性格;勤奋与学习成绩;勤奋与学习成绩;节日与交通状况节日与交通状况【解析解析】是函数关系,其他是相关关系是函数关系,其他是相关关系.答案:答案:1.1.线性回归方程和相关系数公式线性回归方程和相关系数公式这两个公式形式和推导过程都比较复杂,只需要掌握公式的简这两个公式形式和推导过程都比较复杂,只需要掌握公式的简单变形
9、,对于公式的具体形式不要求记忆单变形,对于公式的具体形式不要求记忆.2.2.散点图与相关系数的关系散点图与相关系数的关系通过观察散点图可以判断变量间有无线性相关关系,但只能粗通过观察散点图可以判断变量间有无线性相关关系,但只能粗略地说明两个变量之间关系的密切程度,而相关系数能精确地略地说明两个变量之间关系的密切程度,而相关系数能精确地描述两个变量相关关系的密切程度描述两个变量相关关系的密切程度.3.3.回归分析的意义回归分析的意义(1)(1)回归分析的前提是两个变量之间具有相关关系;回归分析的前提是两个变量之间具有相关关系;(2)(2)对两个变量之间数量变化进行一般关系的测定,确定一个对两个变
10、量之间数量变化进行一般关系的测定,确定一个相应的数学表达式,即线性回归方程,达到由一个已知量推测相应的数学表达式,即线性回归方程,达到由一个已知量推测或控制另一个变量的值的目标,是统计的一个重要方法;或控制另一个变量的值的目标,是统计的一个重要方法;(3)(3)线性回归方程是根据样本数据得到的一个确定性的函数关线性回归方程是根据样本数据得到的一个确定性的函数关系,是用来对未知变量进行预测的,为了预测的效果更好,减系,是用来对未知变量进行预测的,为了预测的效果更好,减小误差,应在求回归方程时尽量多地选取样本,选择代表性较小误差,应在求回归方程时尽量多地选取样本,选择代表性较强的样本,使得预测值尽
11、量地接近真实值强的样本,使得预测值尽量地接近真实值.核心要点是提升学科素养的关键。本栏目突破核心要点,核心要点是提升学科素养的关键。本栏目突破核心要点,讲练结合,提醒认知误区,点拨规律技巧,循序渐进,培养主讲练结合,提醒认知误区,点拨规律技巧,循序渐进,培养主动思考意识,提升自主探究能力。请根据授课情况有选择地讲动思考意识,提升自主探究能力。请根据授课情况有选择地讲解,帮助学生理解突破知识重难点!解,帮助学生理解突破知识重难点!变量间的相关关系及判定变量间的相关关系及判定【技法点拨技法点拨】变量间相关关系判定的前提和方法变量间相关关系判定的前提和方法(1)(1)前提:作出散点图;前提:作出散点
12、图;(2)(2)方法:若图中所有点看上去都在一条直线的附近波动,方法:若图中所有点看上去都在一条直线的附近波动,则这两个变量是线性相关的,若所有的点看上去在某条曲线则这两个变量是线性相关的,若所有的点看上去在某条曲线的附近波动,则称这个变量是非线性相关,若所有点在图中的附近波动,则称这个变量是非线性相关,若所有点在图中没有显示任何关系,则称变量间不相关没有显示任何关系,则称变量间不相关.【典例训练典例训练】1.1.对变量对变量x,yx,y有观测数据有观测数据(x(xi i,y yi i)(i=1,2,)(i=1,2,,10)10),得散点图,得散点图1 1;对变量对变量u u,v v有观测数据
13、有观测数据(u(ui i,v vi i)(i=1,2,)(i=1,2,,10),10),得散点图得散点图2.2.由由这两个散点图可以判断这两个散点图可以判断()()(A)(A)变量变量x x与与y y正相关,正相关,u u与与v v正相关正相关(B)(B)变量变量x x与与y y正相关,正相关,u u与与v v负相关负相关(C)(C)变量变量x x与与y y负相关,负相关,u u与与v v正相关正相关(D)(D)变量变量x x与与y y负相关,负相关,u u与与v v负相关负相关2.2.有下列说法:有下列说法:回归分析就是由样本点去寻找一条直线方程,刻画这些样本回归分析就是由样本点去寻找一条直
14、线方程,刻画这些样本点之间的关系的数学方法;点之间的关系的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以利用样本点的散点图可以直观判断两个变量的关系是否可以利用线性关系表示;利用线性关系表示;通过线性回归方程通过线性回归方程y=bx+ay=bx+a及其回归系数及其回归系数b b,可以估计和预测,可以估计和预测变量的取值和变化趋势;变量的取值和变化趋势;因为任何一组观测值都能求得一个线性回归方程,所以没有因为任何一组观测值都能求得一个线性回归方程,所以没有必要进行相关性检验必要进行相关性检验.其中正确的命题是其中正确的命题是_._.【解析解析】1.1.选选C.C.由这两个散点图可
15、以判断由这两个散点图可以判断,变量变量x x与与y y负相关,负相关,u u与与v v正相关正相关,故选故选C.C.2.2.反映的是最小二乘法思想,是正确的;反映的是最小二乘法思想,是正确的;反映的是散点图的作用,是正确的;反映的是散点图的作用,是正确的;反映的是求线性回归方程反映的是求线性回归方程y=bx+ay=bx+a的目的,是正确的;的目的,是正确的;是不正确的,在求线性回归方程之前必须进行相关性检验,是不正确的,在求线性回归方程之前必须进行相关性检验,以体现两变量的关系以体现两变量的关系.答案:答案:【想一想想一想】判断变量间是否具备相关关系的主要方法是什么?判断变量间是否具备相关关系
16、的主要方法是什么?散点图中点的分布形式主要有几种?散点图中点的分布形式主要有几种?提示:提示:(1)(1)判断变量间是否具备相关关系,主要是利用散点图判断变量间是否具备相关关系,主要是利用散点图或求线性相关系数进行或求线性相关系数进行;(2);(2)散点图中点的分布形式主要有两种,散点图中点的分布形式主要有两种,一种是从左下到右上,另一种是从左上到右下一种是从左下到右上,另一种是从左上到右下.【变式训练变式训练】有五组变量:汽车的重量和汽车每消耗有五组变量:汽车的重量和汽车每消耗1 1升汽升汽油所行驶的平均路程;平均日学习时间和平均学习成绩;油所行驶的平均路程;平均日学习时间和平均学习成绩;某
17、人每日吸烟量和其身体健康情况;正方形的边长和面积;某人每日吸烟量和其身体健康情况;正方形的边长和面积;汽车的重量和百公里耗油量汽车的重量和百公里耗油量.其中两个变量成正相关的是其中两个变量成正相关的是()()(A)(A)(B)(B)(C)(C)(D)(D)【解析解析】选选C.C.其中成负相关关系,成函数关系其中成负相关关系,成函数关系.线性回归方程及相关系数线性回归方程及相关系数【技法点拨技法点拨】线性回归方程的求解步骤线性回归方程的求解步骤第第1 1步:画出散点图,通过图形来判断是否线性相关;步:画出散点图,通过图形来判断是否线性相关;第第2 2步:计算步:计算 的值,代入线性回归方程求解公
18、的值,代入线性回归方程求解公 式解得式解得a a,b b;第第3 3步:写出线性回归方程步:写出线性回归方程y=bx+a.y=bx+a.nn2iiii 1i 1x,y,x,x y【典例训练典例训练】1.1.如图所示的如图所示的5 5组数据中,去掉组数据中,去掉_组数据后,剩下的组数据后,剩下的4 4组数组数据的线性相关系数最大据的线性相关系数最大.().()(A)(A)点点A A(B)(B)点点B B(C)(C)点点C C(D)(D)点点D D2.2.某种产品的广告费用支出某种产品的广告费用支出x x万元与销售额万元与销售额y y万元之间有如下的万元之间有如下的对应数据:对应数据:(1)(1)
19、求求y y对对x x的线性回归方程;的线性回归方程;(2)(2)据此估计广告费用为据此估计广告费用为1010万元时销售收入万元时销售收入y y的值的值.【解析解析】1.1.选选D.D.相关系数反映线性相关程度,要使相关系数比相关系数反映线性相关程度,要使相关系数比原来大,应使得提供的各点尽量在一条直线附近,因此应去掉原来大,应使得提供的各点尽量在一条直线附近,因此应去掉点点D.D.x x2 24 45 56 68 8y y303040405050606070702.(1)2.(1)yy对对x x的线性回归方程为的线性回归方程为y=7x+15.y=7x+15.5222222ii 15iii 15
20、iii 15222ii 11x245685,51y304050607050,5x24568145,x y2 304 405 506 608 701 390,x y5x y1 3905 5 50b7,1455 5x5xaybx507 515,(2)(2)当当x=10 x=10时,预报时,预报y y的值为的值为y=7y=710+15=85.10+15=85.即广告费用为即广告费用为1010万元时销售收入万元时销售收入y y的值大约为的值大约为8585万元万元.【互动探究互动探究】在题在题2 2中,要使这种产品的销售额突破中,要使这种产品的销售额突破150150万元,万元,则广告支出至少多少万元?则
21、广告支出至少多少万元?【解析解析】由由y=7x+15150y=7x+15150,解得,解得x19.3x19.3,即要使这种产品的销售额突破即要使这种产品的销售额突破150150万元,则广告支出至少万元,则广告支出至少19.319.3万元万元.【想一想想一想】求解线性回归方程容易出现哪些错误?求解线性回求解线性回归方程容易出现哪些错误?求解线性回归方程的关键是什么?归方程的关键是什么?提示:提示:(1)(1)求解线性回归方程容易出现不依据散点图判断是否求解线性回归方程容易出现不依据散点图判断是否相关,而直接代入公式求解的错误;相关,而直接代入公式求解的错误;(2)(2)求解线性回归方程的求解线性
22、回归方程的关键是对数据进行准确的处理关键是对数据进行准确的处理.【变式训练变式训练】已知某商品的价格已知某商品的价格x(x(元元)与需求量与需求量y(y(件件)之间的关之间的关系有如下一组数据:系有如下一组数据:(1)(1)画出画出y y关于关于x x的散点图的散点图.(2)(2)用最小二乘法求出需求量用最小二乘法求出需求量y y对商品价格对商品价格x x的线性回归方程的线性回归方程.x x14141616181820202222y y121210107 75 53 3【解析解析】(1)(1)(2)(2),b=-1.15b=-1.15,,线性回归方程为线性回归方程为y=-1.15x+28.1.
23、y=-1.15x+28.1.n2ii 1x18,y7.4,x1 660niii 1x y620aybx28.1可线性化的回归分析可线性化的回归分析【技法点拨技法点拨】求解可线性化的回归分析的具体步骤求解可线性化的回归分析的具体步骤(1)(1)画散点图;画散点图;(2)(2)根据散点图确定相应的回归模型;根据散点图确定相应的回归模型;(3)(3)模型变换;模型变换;(4)(4)求解变换后的回归方程;求解变换后的回归方程;(5)(5)求求y y与与x x间的回归方程间的回归方程.【典例训练典例训练】1.1.两个变量的散点图如图,可考虑用如下函数进行拟合比较合两个变量的散点图如图,可考虑用如下函数进
24、行拟合比较合理的是理的是()()(A)y=ax(A)y=axb b(B)y=a+blnx(B)y=a+blnx(C)y=ae(C)y=aebxbx(D)(D)bxya e 2.2.下表是我国下表是我国1950-19591950-1959年人口数据资料年人口数据资料若若y y与与t t之间近似满足之间近似满足y=aey=aebtbt,求人口,求人口y y对年份对年份t t的回归方程,的回归方程,若按此增长趋势,估计大约在哪一年我国人口达到若按此增长趋势,估计大约在哪一年我国人口达到1414亿?亿?年份年份1950195019511951195219521953195319541954195519
25、5519561956195719571958195819591959t t0 01 12 23 34 45 56 67 78 89 9人口人口y(y(万万人人)55 19655 19656 30056 30057 48257 48258 79658 79660 26660 26661 45661 45662 82862 82864 56364 56365 99465 99467 20767 207【解析解析】1.1.选选B.B.由散点图知,此曲线类似对数函数型曲线,可由散点图知,此曲线类似对数函数型曲线,可用用B B项函数进行拟合项函数进行拟合.2.2.设设u=lnyu=lny,c=lnac=
26、lna,则,则u=c+btu=c+bt,记,记19501950年为年为t=0,t=0,则上表中数据则上表中数据经变换后如下表:经变换后如下表:t t0 01 12 23 34 4u u10.91810.918 6 610.938 410.938 410.959 210.959 210.981 810.981 811.00611.006 5 5t t5 56 67 78 89 9u u11.02611.026 1 111.04811.048 2 211.07511.075 4 411.09711.097 3 3 11.115 5 11.115 5 10102iiii 1i 1t4.5,u11.0
27、16 7t285,t u497.593 6,,10iii 1n222ii 1t u10t u497.593 6 10 4.5 11.016 7b0.022 3,285 10 4.5t10t10.916 4 0.022 3tcubt11.016 70.022 3 4.510.916 4,u10.916 40.022 3t,ye令令y=140 000y=140 000,则,则10.916 4+0.022 3t=ln140 00010.916 4+0.022 3t=ln140 000所以所以t41.838 5t41.838 5,即大约在,即大约在19501950年后的第年后的第4242年年(即即19
28、92)1992)年我年我国人口达到国人口达到1414亿亿.【想一想想一想】求解可线性化的回归分析问题的关键是什么?解决求解可线性化的回归分析问题的关键是什么?解决这类问题容易忽视的环节有哪些?这类问题容易忽视的环节有哪些?提示:提示:(1)(1)求解可线性化的回归分析问题的关键是回归模型的求解可线性化的回归分析问题的关键是回归模型的选取和变换;选取和变换;(2)(2)解决这类问题容易忽视的问题是最后的回归解决这类问题容易忽视的问题是最后的回归方程的还原方程的还原.【变式训练变式训练】某地区不同身高的未成年男性的体重平均值如下某地区不同身高的未成年男性的体重平均值如下表:表:身高身高x/cmx/
29、cm6060707080809090100100110110体重体重y/kgy/kg6.136.137.907.909.999.9912.1512.1515.0215.0217.5017.50身高身高x/cmx/cm120120130130140140150150160160170170体重体重y/kgy/kg20.9220.9226.8626.8631.1131.1138.8538.8547.2547.2555.0555.05(1)(1)试建立试建立y y与与x x之间的回归方程之间的回归方程;(2)(2)若体重超过相同身高男性体重平均值的若体重超过相同身高男性体重平均值的1.21.2倍为偏
30、胖倍为偏胖,低于低于0.80.8倍为偏瘦倍为偏瘦,那么这个地区一名身高为那么这个地区一名身高为175 cm175 cm体重为体重为82 kg82 kg的在校男的在校男生体重是否正常生体重是否正常?【解题指南解题指南】解答本题可先画出散点图,判断身高和体重是否解答本题可先画出散点图,判断身高和体重是否线性相关,若不是线性相关,则转化为线性相关再求出回归方线性相关,若不是线性相关,则转化为线性相关再求出回归方程,然后,再预测身高为程,然后,再预测身高为175 cm175 cm的体重是多少来判断体重是否的体重是多少来判断体重是否正常正常.【解析解析】(1)(1)根据上表中的数据画出散点图根据上表中的
31、数据画出散点图(如图所示如图所示).).由图可看出由图可看出,样本点分布在某条指数型函数曲线样本点分布在某条指数型函数曲线y=cy=c1 1e ec c2 2x x的周围的周围,于是令于是令z=lny,z=lny,得下表得下表:作出散点图如图所示作出散点图如图所示.x x6060707080809090100100110110120120130130140140150150160160170170z z1.811.812.072.072.302.302.502.502.712.712.862.863.043.043.293.293.443.443.663.663.863.864.014.01由
32、表中数据可得由表中数据可得z z与与x x之间的线性回归方程为之间的线性回归方程为z=0.693+0.020 x,z=0.693+0.020 x,则有则有y=ey=e0.693+0.020 x0.693+0.020 x.(2)(2)当当x=175x=175时时,预测平均体重为预测平均体重为y=ey=e0.693+0.0200.693+0.02017517566.22,66.22,由于由于66.2266.221.279.4782,1.279.4782,所以这个男生偏胖所以这个男生偏胖.规避误区、规范解答是提高数学成绩的有效途径。本栏目规避误区、规范解答是提高数学成绩的有效途径。本栏目通过通过“见
33、式得分,踩点得分见式得分,踩点得分”呈现得分点,点评失分点,帮助呈现得分点,点评失分点,帮助学生形成识错、纠错、避错能力,借以养成严谨的数学思维和学生形成识错、纠错、避错能力,借以养成严谨的数学思维和良好的规范答题习惯。良好的规范答题习惯。【规范解答规范解答】与线性回归方程相关的综合问题与线性回归方程相关的综合问题【典例典例】(12(12分分)某研究性学习小组对春季昼夜温差大小与某花某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了卉种子发芽多少之间的关系进行研究,他们分别记录了3 3月月1 1日日至至3 3月月5 5日的每天昼夜温差日的每天昼夜温差x()
34、x()与实验室每天每与实验室每天每100100颗种子浸泡颗种子浸泡后的发芽数后的发芽数y(y(颗颗),得到如下资料:,得到如下资料:日期日期3 3月月1 1日日3 3月月2 2日日3 3月月3 3日日3 3月月4 4日日3 3月月5 5日日温差温差x/x/10101111131312128 8发芽数发芽数y/y/颗颗23232525303026261616(1)(1)从从3 3月月1 1日至日至3 3月月5 5日中任选日中任选2 2天,记发芽的种子数分别为天,记发芽的种子数分别为m m,n n,求事件求事件m m,n n均不小于均不小于2525的概率;的概率;(2)(2)若选取的是若选取的是3
35、 3月月1 1日与日与3 3月月5 5日的两组数据,请根据日的两组数据,请根据3 3月月2 2日至日至3 3月月4 4日的数据,求出日的数据,求出y y关于关于x x的线性回归方程的线性回归方程y=bx+ay=bx+a;(3)(3)若由线性回归方程得到的估计数据与所选出的检验数据的若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过误差均不超过2 2颗,则认为得到的线性回归方程是可靠的,试颗,则认为得到的线性回归方程是可靠的,试问问(2)(2)中所得的线性回归方程是否可靠?中所得的线性回归方程是否可靠?【解题指导解题指导】【规范解答规范解答】(1)m(1)m,n n的所有取值情况有的
36、所有取值情况有(23(23,25)25),(23(23,30)30),(23(23,26)26),(23(23,16)16),(25(25,30)30),(25(25,26)26),(25(25,16)16),(30(30,26)26),(30(30,16)16),(26(26,16)16),共有共有1010个个 2 2分分设设“m m,n n均不小于均不小于2525”为事件为事件A A,则包含的基本事件有,则包含的基本事件有(25(25,30)30),(25(25,26)26),(30(30,26)26),所以所以 ,故事件,故事件A A的概率为的概率为 .3 3分分 3P A10310(2
37、)(2)由数据得由数据得 6 6分分由公式由公式,得,得y y关于关于x x的线性回归方程为的线性回归方程为 .9 9分分x12,y27,3xy972,3322iiii 1i 1x434,x y977,3x432,3iii 1322ii 1x y3xy9779725b,4344322x3x5aybx27 123,2 5yx32(3)(3)当当x=10 x=10时,时,y=22y=22,|22-23|2|22-23|2,当,当x=8x=8时,时,y=17,|17-16|y=17,|17-16|2.2.所以得到的线性回归方程是可靠的所以得到的线性回归方程是可靠的.12 12分分【阅卷人点拨阅卷人点
38、拨】通过阅卷后分析,对解答本题的失分警示和解通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:题启示总结如下:(注:此处的见规范解答过程注:此处的见规范解答过程)失失分分警警示示在解题过程中,若对古典概型中的事件数处理错误,即在解题过程中,若对古典概型中的事件数处理错误,即处基本事件和满足条件的事件数分别是处基本事件和满足条件的事件数分别是10,310,3;若事件数求;若事件数求解错误进而导致概率求解错误,考试中至少失掉解错误进而导致概率求解错误,考试中至少失掉3 3分;分;若在求解线性回归方程的过程中,处数据处理不当引发若在求解线性回归方程的过程中,处数据处理不当引发错误,数值过大过多
39、是产生错误的根源,另外易将线性回错误,数值过大过多是产生错误的根源,另外易将线性回归方程的书写形式和一次函数混淆导致失误,此处失误至归方程的书写形式和一次函数混淆导致失误,此处失误至少失掉少失掉2 2分;分;失失分分警警示示若在处出现全部数据进行验证的解题方式,未若在处出现全部数据进行验证的解题方式,未能理解数据误差标准的含义,虽然不会导致失分,能理解数据误差标准的含义,虽然不会导致失分,但加大了解题的复杂程度但加大了解题的复杂程度.解解题题启启示示利用线性回归分析,最主要的过程是求解回归方程,而利用线性回归分析,最主要的过程是求解回归方程,而这一过程的前提是依据散点图对相关性进行判断,解题这
40、一过程的前提是依据散点图对相关性进行判断,解题时还要注意对数据的准确处理时还要注意对数据的准确处理.【规范训练规范训练】(12(12分分)某车间为了规定工时定额,需要确定加工某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了数据统计如下:零件所花费的时间,为此进行了数据统计如下:零件的个数零件的个数x(x(个个)2 23 34 45 5加工的时间加工的时间y(y(小时小时)2.52.53 34 44.54.5(1)(1)在给定坐标系中画出表中数据的散点图;在给定坐标系中画出表中数据的散点图;(2)(2)求求y y关于关于x x的线性回归方程的线性回归方程y=bx+ay=bx+a;
41、(3)(3)试预测加工试预测加工1010个零件需要多少时间?个零件需要多少时间?【解题设问解题设问】求解线性回归方程的过程中需要求出求解线性回归方程的过程中需要求出 的值的值吗?吗?_.【规范答题规范答题】(1)(1)散点图如图:散点图如图:3 3分分n2ii 1y不需要不需要(2)(2)5 5分分 7 7分分y y关于关于x x的线性回归方程为的线性回归方程为y=0.7x+1.05.y=0.7x+1.05.9 9分分23452.5344.5x3.5,y3.5,44 4iii 1x y2 2.53 34 45 4.552.5,42ii 1x49 162554,4iii 14222ii 1x y
42、4xy52.54 3.5 3.5b0.7,544 3.5x4x aybx3.50.7 3.51.05,(3)(3)当当x=10 x=10时,时,y=0.7y=0.710+1.05=8.05,10+1.05=8.05,预测加工预测加工1010个零件需要个零件需要8.058.05小时小时.1212分分 1.1.下列变量间关系是相关关系的是下列变量间关系是相关关系的是()()学生的学习态度与学习成绩;学生的学习态度与学习成绩;教师的执教水平与学生的学习成绩;教师的执教水平与学生的学习成绩;学生的身高与学生学习成绩;学生的身高与学生学习成绩;家庭经济条件与学生学习成绩家庭经济条件与学生学习成绩.(A)
43、(A)(B)(B)(C)(C)(D)(D)【解析解析】选选A.A.不具有相关关系不具有相关关系.2.2.工人月工资工人月工资(元元)依劳动生产率依劳动生产率(千元千元)变化的回归方程为变化的回归方程为y=60+90 xy=60+90 x,下列判断正确的是,下列判断正确的是()()(A)(A)劳动生产率为劳动生产率为10001000元时,工资为元时,工资为150150元元(B)(B)劳动生产率提高劳动生产率提高10001000元时,工资提高元时,工资提高150150元元(C)(C)劳动生产率提高劳动生产率提高10001000元时,工资提高元时,工资提高9090元元(D)(D)劳动生产率为劳动生产
44、率为10001000元时,工资为元时,工资为9090元元【解析解析】选选C.C.此直线的斜率为此直线的斜率为9090,所以劳动生产率提高,所以劳动生产率提高10001000元元时,工资提高时,工资提高9090元元.3.3.在两个变量在两个变量y y与与x x的回归模型中,分别选择了的回归模型中,分别选择了4 4个不同的模型,个不同的模型,它们的相关系数它们的相关系数r r如下,其中拟合程度最好的模型是如下,其中拟合程度最好的模型是()()(A)(A)模型模型1 1的相关系数为的相关系数为0.990.99(B)(B)模型模型2 2的相关系数为的相关系数为0.960.96(C)(C)模型模型3 3
45、的相关系数为的相关系数为0.760.76(D)(D)模型模型4 4的相关系数为的相关系数为0.850.85【解析解析】选选A.A.相关系数的绝对值越接近相关系数的绝对值越接近1 1,则相应的回归模型拟,则相应的回归模型拟合程度越好合程度越好.4.4.某同学由某同学由x x与与y y之间的数据关系求得两个变量间的线性回归方之间的数据关系求得两个变量间的线性回归方程为程为y=bx-1y=bx-1,已知数据,已知数据x x的平均值为的平均值为2 2,y y的平均值为的平均值为3 3,则,则b b的的值为值为 _._.【解析解析】由线性回归方程知,点由线性回归方程知,点(2,3)(2,3)在方程在方程
46、y=bx-1y=bx-1上,将上,将(2,3)(2,3)代入得代入得b=2.b=2.答案:答案:2 25.5.已知变量已知变量x x,y y有下列四对对应数据:有下列四对对应数据:求求y y关于关于x x的回归方程的回归方程.【解析解析】所以所以 a=1.75-0.8a=1.75-0.82.5=-0.25,2.5=-0.25,所以所以y y关于关于x x的回归方程为的回归方程为y=bx+a=0.8x-0.25.y=bx+a=0.8x-0.25.x x1 12 23 34 4y y0.50.51.51.52 23 3x2.5,y1.75,4iii 1422ii 1x y4xybx4x222221 0.52 1.56 124 2.5 1.750.8,12344 2.5